Аннотация:
В статье показана актуальность задачи преобразования
в текстовой формат элементов изображений, содержащих последовательности
машинописных цифр. На примере распознавания табличной информации из отсканированных документов ППК «Роскадастр» предложено возможное решение
этой задачи с использованием свёрточных нейронных сетей (CNN). Описаны
принципы формирования наборов данных и моделей CNN для распознавания
последовательностей из двух, трёх и четырёх цифр. Приведены результаты
экспериментального исследования этих моделей и показана их эффективность.
Описана интеграция моделей CNN в разрабатываемую в настоящее время
информационную систему (ИС), предназначенную для автоматизированного
перевода отсканированных документов в их текстовые аналоги.
Ключевые слова и фразы:Распознавание цифр, свёрточные нейронные сети,
CNN, Keras, Python.