RUS  ENG
Полная версия
ЖУРНАЛЫ // Математическое образование // Архив

Матем. обр., 2018, выпуск 4(88), страницы 38–49 (Mi mo655)

Студентам и преподавателям математических специальностей

Алгоритмы и методы построения программы-дескриптора, осуществляющей распознавание графических изображений

А. Ф. Ляхов, Е. И. Чнегов

Институт информационных технологий, математики и механики, Нижегородский государственный университет им. Н. И. Лобачевского

Аннотация: В работе описывается новый оригинальный дескриптор CPAFD (Color Periphery Area Fields Descriptor), позволяющий осуществлять категоризацию как статичных изображений, так и видеопотока.
Исходная задача имеет следующий вид. Требуется определить присутствие некоторого объекта на заданном изображении.
В исходном изображении, как правило, содержится большое количество информации, которая является избыточной для решения задачи классификации. Поэтому проводится предобработка изображения. Она сводится к следующим, последовательно выполняемым процедурам. Осуществляется переход к восьми чистым цветам и определяется сегментная структура изображения, то есть определяется количество областей однородности различного цвета, их средние периметр и площадь. В основе определения областей однородности и их границ лежит классический двухпроходной алгоритм поиска областей связности с последующим отбросом внутренних пикселей. В результате предобработки получается двадцатичетырехмерный вектор признаков изображения.
Категоризация изображений проводится с помощью метрического классификатора. При создании классификатора рассматривается множество изображений, содержащих искомый объект, и определяются их векторы признаков, то есть создается база прецедентов. Возможность классификации основывается на гипотезе компактности, в которой утверждается, что векторы изображений, содержащих подобные объекты, образуют некоторое компактное множество.
Вектор признаков классифицируемого объекта подается на вход классификатору, который определяет расстояние между ним и всеми прецедентами. Классифицирование осуществляется на основе алгоритма окна Парзена переменной ширины. Качество работы данного метода зависит от количества соседей, с которыми сравнивается объект. Для того, чтобы качество классификации было максимальным, требуется обучить классификатор, то есть найти оптимальное количество соседей, при котором количество ошибок будет минимально.
На основе близости исследуемого изображения к прецедентам принимается решение о наличии объекта на заданном изображении.

Ключевые слова: дескриптор, распознавание образов, классификация изображений.

УДК: 519.688



© МИАН, 2024