Аннотация:
В работе предложен метод распознавания содержимого
отсканированных изображений плохого качества с использованием свёрточных
нейронных сетей (CNN) и его программная реализация. Метод состоит из 3-х
основных этапов.
На первом этапе осуществляется предобработка изображения с целью
выявлении контуров его буквенных и цифровых элементов и основных
знаков пунктуации.
На втором этапе содержимое фрагментов изображения внутри выявленных контуров последовательно подаётся на вход CNN, реализующую
многоклассовую классификацию.
На третьем, заключительном этапе, осуществляется постобработка совокупности ответов CNN и формирование текстового документа с результатами
распознавания.
Все этапы реализованы на языке Python с использованием библиотек
глубокого обучения Keras, компьютерного зрения OpenCV и обработки
изображений PIL. Предлагаемый в работе способ показал достаточно
хорошие результаты распознавания для основных типов ухудшения качества
отсканированного изображения — геометрических искажений, размытия
границ, различных пометок на исходном и отсканированном изображении и т.п.
Ключевые слова и фразы:
обработка изображений, свёрточная нейронная сеть, Python, Keras, OpenCV.