RUS  ENG
Полная версия
ЖУРНАЛЫ // Информатика и автоматизация // Архив

Тр. СПИИРАН, 2011, выпуск 16, страницы 110–122 (Mi trspy420)

Методы сегментации OCR систем в задачах автоматической обработки архивных документов

С. В. Кулешов, С. В. Смирнов

Санкт-Петербургский институт информатики и автоматизации РАН

Аннотация: Настоящая статья описывает сравнение современных систем оптического распознавания, проводимого с целью определения систем наиболее точно выполняющих сегментацию документов по заранее заданным критериям; определение возможностей систем по выделению различных типов областей. В статье анализируются результаты работы методов сегментации OCR систем, оценивается эффективность процесса сегментации. Основываясь на результатах исследования и сделанных наблюдениях, приводится список рекомендаций по выбору OCR систем и методов для обработки различных типов документов.

Ключевые слова: системы оптического распознавания, методы сегментации, OCR системы, структурный анализ документа, оптическое распознавание, оцифровка архивных документов.

УДК: 004.6

Поступила в редакцию: 24.01.2011



© МИАН, 2024