Аннотация:
В контексте распознавания неоцифрованных изображений, имеющих низкое качество из-за наличия различных шумов, предложена модель процесса распознавания символов, позволяющая учитывать разное качество входных изображений. Решается проблема распознавания изображений, содержащих разные типы шумов. Алгоритмы, которые сглаживают изображение и убирают плотное скопление шума, зачастую не справляются с шумами, разбросанными по всему изображению равномерно («соль»), а использование сразу нескольких алгоритмов подавления шума может отразиться на качестве изображения. Если подобрать неподходящий алгоритм размытия, впоследствии при поиске границ можно получить менее точные координаты контуров изображения для дальнейшей сегментации и распознавания. При сегментации изображения может случится так, что в связи с некорректной обработкой процесс поиска пикселей символов приведет к неправильному результату. Чтобы решить эту проблему, предлагается сформировать множество алгоритмов размытия и множество алгоритмов бинаризации. На этапе обработки изображения использование множества сочетаний вместо одного конкретного сочетания алгоритмов поможет добиться более гибкой и устойчивой к различным типам дефектов на изображениях работы модуля распознавания. Разработанная модель процесса распознавания символов поможет достигнуть значительного повышения точности распознавания неоцифрованных документов за счет наиболее эффективной обработки изображений, имеющих различный шум. Помимо удаления шумов, усовершенствованная модель позволит более точно находить границы изображений, которые имеют проблемы с качеством. Теоретической значимостью исследования является результат моделирования процесса распознавания символов, использующего множество сочетаний алгоритмов обработки изображения, для проведения более обширного анализа и выявления наиболее эффективных сочетаний алгоритмов.