Аннотация:
Настоящая статья описывает сравнение современных систем оптического распознавания, проводимого с целью определения систем наиболее точно выполняющих сегментацию документов по заранее заданным критериям; определение возможностей систем по выделению различных типов областей. В статье анализируются результаты работы методов сегментации OCR систем, оценивается эффективность процесса сегментации. Основываясь на результатах исследования и сделанных наблюдениях, приводится список рекомендаций по выбору OCR систем и методов для обработки различных типов документов.
Ключевые слова:системы оптического распознавания, методы сегментации, OCR системы, структурный анализ документа, оптическое распознавание, оцифровка архивных документов.