RUS  ENG
Полная версия
ЖУРНАЛЫ // Программные системы: теория и приложения // Архив

Программные системы: теория и приложения, 2022, том 13, выпуск 3, страницы 29–43 (Mi ps396)

Эта публикация цитируется в 5 статьях

Искусственный интеллект, интеллектуальные системы, нейронные сети

Использование свёрточной нейронной сети для распознавания элементов текста на отсканированных изображениях плохого качества

И. В. Винокуров

Финансовый университет при Правительстве Российской Федерации, г. Москва

Аннотация: В работе предложен метод распознавания содержимого отсканированных изображений плохого качества с использованием свёрточных нейронных сетей (CNN) и его программная реализация. Метод состоит из 3-х основных этапов.
На первом этапе осуществляется предобработка изображения с целью выявлении контуров его буквенных и цифровых элементов и основных знаков пунктуации.
На втором этапе содержимое фрагментов изображения внутри выявленных контуров последовательно подаётся на вход CNN, реализующую многоклассовую классификацию.
На третьем, заключительном этапе, осуществляется постобработка совокупности ответов CNN и формирование текстового документа с результатами распознавания.
Все этапы реализованы на языке Python с использованием библиотек глубокого обучения Keras, компьютерного зрения OpenCV и обработки изображений PIL. Предлагаемый в работе способ показал достаточно хорошие результаты распознавания для основных типов ухудшения качества отсканированного изображения — геометрических искажений, размытия границ, различных пометок на исходном и отсканированном изображении и т.п.

Ключевые слова и фразы: обработка изображений, свёрточная нейронная сеть, Python, Keras, OpenCV.

УДК: 004.932.75'1+004.89

MSC: Primary 68T20; Secondary 68T07, 68T45

Поступила в редакцию: 28.07.2022
Подписана в печать : 15.09.2022

DOI: 10.25209/2079-3316-2022-13-3-29-43


 Англоязычная версия: , 2022, 13:3, 45–59


© МИАН, 2025