RUS  ENG
Полная версия
ЖУРНАЛЫ // Компьютерная оптика // Архив

Компьютерная оптика, 2020, том 44, выпуск 6, страницы 968–977 (Mi co871)

Эта публикация цитируется в 5 статьях

ЧИСЛЕННЫЕ МЕТОДЫ И АНАЛИЗ ДАННЫХ

Детектирование книг на книжных полках при помощи глубоких нейронных сетей

М. О. Калинина, П. Л. Николаев

Московский авиационный институт (национальный исследовательский университет), 121552, Россия, г. Москва, ул. Оршанская, д. 3

Аннотация: Глубокие нейронные сети в настоящее время получили широкое распространение в различных сферах деятельности человека, в том числе тех, где требуется работа с большим объемом данных, а также операции по получению и обработке информации из окружающего мира. В данной статье рассмотрено создание сверточной нейронной сети на основе архитектуры YOLO по детектированию книг в режиме реального времени. Описаны процесс создания собственного набора данных и обучение на нем глубокой нейронной сети. Приведена структура полученной нейронной сети, и рассмотрены наиболее часто используемые метрики для оценки качества ее работы. Также сделан краткий обзор существующих видов архитектур нейронных сетей. Выбранная в качестве основы для нейросети архитектура обладает рядом преимуществ, позволяющих ей в значительной мере конкурировать с другими моделями нейросетей и делающих ее наиболее подходящим вариантом для создания сети, нацеленной на детектирование объектов, так как при ее разработке были значительно снивелированы некоторые часто встречающиеся недостатки подобных сетей (проблемы с распознаванием схожих по оформлению, имеющих одинаковый цвет обложек или расположенных под наклоном книг). Результаты, полученные в ходе обучения глубокой нейронной сети, позволяют использовать ее в качестве основы для дальнейшей разработки приложения, целью которого будет являться детектирование книг по книжным корешкам.

Ключевые слова: распознавание изображений, детектирование объектов, компьютерное зрение, машинное обучение, искусственные нейронные сети, глубокое обучение, сверточные нейронные сети.

Поступила в редакцию: 04.04.2020
Принята в печать: 07.10.2020

DOI: 10.18287/2412-6179-CO-731



© МИАН, 2024