RUS  ENG
Полная версия
ЖУРНАЛЫ // Информационные технологии и вычислительные системы // Архив

ИТиВС, 2019, выпуск 3, страницы 66–78 (Mi itvs354)

Эта публикация цитируется в 4 статьях

РАСПОЗНАВАНИЕ ОБРАЗОВ

Метод сегментации структурированных текстовых объектов на изображении с помощью динамического программирования

М. А. Поволоцкийabc, Д. В. Тропинca, Т. С. Черновc, Б. И. Савельевc

a Московский физико-технический институт (государственный университет), г. Долгопрудный, Россия
b Институт проблем передачи информации им. А.А. Харкевича Российской академии наук, г. Москва, Россия
c Смарт Энджинс Сервис, г. Москва, Россия

Аннотация: Рассматривается задача сегментации изображений текстовых фрагментов с известными ограничениями на взаимное расположение элементов. Рассматривается модель, в которой граф ограничений является простой цепью. Показано, что задача сегментации в этом случае может быть решена точно с помощью алгоритма динамического программирования, причем этот алгоритм обладает оптимальной асимптотической трудоемкостью. Данный алгоритм был встроен в две системы распознавания. Первая система предназначена для распознавания документов, удостоверяющих личность, таких как паспорта и водительские права. Вторая система предназначена для распознавания автомобильных номеров, в ней предложенный алгоритм был использован для сегментации номеров на отдельные символы. Проведены эксперименты на закрытом наборе данных по замеру качества и производительности полученных решений на мобильном телефоне. Экспериментальные результаты показали, что полученные решения превосходят по качеству алгоритмы, не использующие ограничения на взаимное расположение элементов, а их трудоемкость позволяет работать на мобильных устройствах в режиме реального времени.

Ключевые слова: сегментация текста, динамическое программирование, распознавание документов, обработка изображений, OCR.

DOI: 10.14357/20718632190306



© МИАН, 2024