М. А. Поволоцкий, Д. В. Тропин, Т. С. Чернов, Б. И. Савельев, “Метод сегментации структурированных текстовых объектов на изображении с помощью динамического программирования”, ИТиВС, 2019, выпуск 3,страницы 66

Эта публикация цитируется в 4 статьях

РАСПОЗНАВАНИЕ ОБРАЗОВ

Метод сегментации структурированных текстовых объектов на изображении с помощью динамического программирования

М. А. Поволоцкий^abc, Д. В. Тропин^ca, Т. С. Чернов^c, Б. И. Савельев^c

^a Московский физико-технический институт (государственный университет), г. Долгопрудный, Россия
^b Институт проблем передачи информации им. А.А. Харкевича Российской академии наук, г. Москва, Россия
^c Смарт Энджинс Сервис, г. Москва, Россия

Аннотация: Рассматривается задача сегментации изображений текстовых фрагментов с известными ограничениями на взаимное расположение элементов. Рассматривается модель, в которой граф ограничений является простой цепью. Показано, что задача сегментации в этом случае может быть решена точно с помощью алгоритма динамического программирования, причем этот алгоритм обладает оптимальной асимптотической трудоемкостью. Данный алгоритм был встроен в две системы распознавания. Первая система предназначена для распознавания документов, удостоверяющих личность, таких как паспорта и водительские права. Вторая система предназначена для распознавания автомобильных номеров, в ней предложенный алгоритм был использован для сегментации номеров на отдельные символы. Проведены эксперименты на закрытом наборе данных по замеру качества и производительности полученных решений на мобильном телефоне. Экспериментальные результаты показали, что полученные решения превосходят по качеству алгоритмы, не использующие ограничения на взаимное расположение элементов, а их трудоемкость позволяет работать на мобильных устройствах в режиме реального времени.

Ключевые слова: сегментация текста, динамическое программирование, распознавание документов, обработка изображений, OCR.

DOI: 10.14357/20718632190306