RUS  ENG
Полная версия
ЖУРНАЛЫ // Информационные технологии и вычислительные системы // Архив

ИТиВС, 2023, выпуск 4, страницы 37–48 (Mi itvs833)

ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ И ТЕХНОЛОГИИ

Алгоритмы привязки полей при распознавании условно жестких деловых документов

О. А. Славинab

a Федеральный исследовательский центр «Информатика и управление» Российской академии наук, Москва, Россия
b ООО "Смарт Энджинс Сервис", Москва, Россия

Аннотация: Предложены определения гибких и жестких документов, используемые в технологиях ввода в компьютер деловых документов. Рассмотрены особенности создания, оцифровки и анализа жестких форм и жестких документов. Описаны границы применимости модели привязки изображений жестких документов, искаженных при оцифровке. Рассмотрена модель для привязки гибких документов, основанная на распознанных словах и графических примитивах, связанных набором отношений порядка. Классификация основана на различных способах подготовки деловых документов для печати. Описаны особенности привязки полей и распознавания для нескольких типов документов, таких как условно-жесткие документы, гибкие документы, продуцированные одной формой, гибкие документы, продуцированные малым и большим числом форм. Рассмотрен случай распознавания условно-жестких документов с применением технологий ввода гибких документов.
Проведенные эксперименты показывают, что для некоторых полей пометок в условиях сильного зашумления и значительных искажений доля ошибок уменьшается в два раза.

Ключевые слова: распознавание документов, условно-жесткий документ, текстовая особая точка, пометка.

DOI: 10.14357/20718632230404



Реферативные базы данных:


© МИАН, 2024