В. В. Арлазаров, “Анализ использования проблемно-ориентированных пакетов данных в научных исследованиях”, ИТиВС, 2022, выпуск 3,страницы 10

ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ И ТЕХНОЛОГИИ

Анализ использования проблемно-ориентированных пакетов данных в научных исследованиях

В. В. Арлазаров^ab

^a Федеральное государственное учреждение «Информатика и управление» Российской академии наук, г. Москва, Россия
^b ООО "СМАРТ ЭНДЖИНС СЕРВИС", г. Москва

Аннотация: В работе рассматривается проблемы создания и использования открытых проблемно-ориентированных пакетов данных для проведения экспериментальных исследований с проверяемыми и воспроизводимыми результатами, на примере опыта создания пакетов семейства MIDV, содержащих изображения и видеопоследовательности идентификационных документов. Проведен анализ опубликованных научных работ в областях компьютерного зрения, обработки изображений и вычислительной лингвистики, использующих эти пакеты данных, описаны основные проблемы, с которыми сталкивались научные группы, и выявлены общие закономерности и принципы, которые могут быть использованы для создания пакетов данных такого класса и для расширения существующих.

Ключевые слова: распознавание текста, анализ документов, пакеты данных, воспроизводимость исследований, OCR, обработка изображений.

DOI: 10.14357/20718632220302