RUS  ENG
Полная версия
ЖУРНАЛЫ // Информатика и автоматизация // Архив

Тр. СПИИРАН, 2020, выпуск 19, том 6, страницы 1222–1254 (Mi trspy1131)

Искусственный интеллект, инженерия данных и знаний

Comparison of two objects classification techniques using Hidden Markov Models and Convolutional Neural Networks

[Сравнение двух методов классификации объектов с использованием скрытых марковских моделей и сверточных нейронных сетей]

C. Sarmiento, J. Savage

National Autonomous University of Mexico (UNAM)

Аннотация: Представлено сравнение дискретных скрытых марковских моделей и свёрточных нейронных сетей для классификации изображений. После разбивки изображений на части целесообразно получить векторы, которые представляют локальные визуальные структуры, одновременно определяющие изображения глобально через пространственную последовательность. С использованием методов кластеризации создается алфавит из указанных векторов, а затем конструируются последовательности символов, которые описывают статистические модели, соответствующие классам изображений. Скрытые марковские модели в сочетании с методами квантования могут обрабатывать шум и искажения в наблюдениях для решения проблем компьютерного зрения, таких как классификация изображений с изменением освещения и перспективы.
Протестированы архитектуры, основанные на трех, шести и девяти скрытых состояниях, в пользу скорости обнаружения и низкого использования памяти. Также были протестированы два типа ансамблевых моделей. Точность предлагаемого метода была оценена с помощью общедоступных данных; полученные результаты оказались сравнимы с известными оценками при использовании тонко настроенных свёрточных нейронных сетей, но требовали значительно меньших вычислительных ресурсов. Результат представляет интерес при разработке мобильных роботов с вычислительными устройствами, имеющими ограниченное время автономной работы, но требующими способности обнаруживать и добавлять новые объекты в свои системы классификации.

Ключевые слова: скрытые марковские модели, классификация изображений, компьютерное зрение, распознавание образов.

УДК: 004.9

Поступила в редакцию: 02.10.2020

Язык публикации: английский

DOI: 10.15622/ia.2020.19.6.4



© МИАН, 2024