А. И. Сабиров, А. С. Катасёв, М. В. Дагаева, “Нейросетевая модель распознавания знаков дорожного движения в интеллектуальных транспортных системах”, Компьютерные исследования и моделирование, 2021, том 13, выпуск 2,страницы 429

Эта публикация цитируется в 6 статьях

СПЕЦИАЛЬНЫЙ ВЫПУСК
ОБРАБОТКА ВИДЕОИЗОБРАЖЕНИЙ В ИНТЕЛЛЕКТУАЛЬНЫХ ТРАНСПОРТНЫХ СИСТЕМАХ

Нейросетевая модель распознавания знаков дорожного движения в интеллектуальных транспортных системах

А. И. Сабиров, А. С. Катасёв, М. В. Дагаева

Казанский национальный исследовательский технический университет им. А. Н. Туполева — КАИ, Россия, 420111, г. Казань, ул. К. Маркса, д. 10

Аннотация: В данной статье проводится анализ проблемы распознавания знаков дорожного движения в интеллектуальных транспортных системах. Рассмотрены основные понятия компьютерного зрения и задачи распознавания образов. Самым эффективным и популярным подходом к решению задач анализа и распознавания изображений на данный момент является нейросетевой, а среди возможных нейронных сетей лучше всего показала себя искусственная нейронная сеть сверточной архитектуры. Для решения задачи классификации при распознавании дорожных знаков использованы такие функции активации, как Relu и SoftMax. В работе предложена технология распознавания дорожных знаков. Выбор подхода для решения поставленной задачи на основе сверточной нейронной сети обусловлен возможностью эффективно решать задачу выделения существенных признаков и классификации изображений. Проведена подготовка исходных данных для нейросетевой модели, сформирована обучающая выборка. В качестве платформы для разработки интеллектуальной нейросетевой модели распознавания использован облачный сервис Google Colaboratory с подключенными библиотеками для глубокого обучения TensorFlow и Keras. Разработана и протестирована интеллектуальная модель распознавания знаков дорожного движения. Использованная сверточная нейронная сеть включала четыре каскада свертки и подвыборки. После сверточной части идет полносвязная часть сети, которая отвечает за классификацию. Для этого используются два полносвязных слоя. Первый слой включает 512 нейронов с функцией активации Relu. Затем идет слой Dropout, который используется для уменьшения эффекта переобучения сети. Выходной полносвязный слой включает четыре нейрона, что соответствует решаемой задаче распознавания четырех видов знаков дорожного движения. Оценка эффективности нейросетевой модели распознавания дорожных знаков методом трехблочной кросс-валидации показала, что ее ошибка минимальна, следовательно, в большинстве случаев новые образы будут распознаваться корректно. Кроме того, у модели отсутствуют ошибки первого рода, а ошибка второго рода имеет низкое значение и лишь при сильно зашумленном изображении на входе.

Ключевые слова: сверточная нейронная сеть, анализ данных, распознавание дорожных знаков, интеллектуальные транспортные системы.

УДК: 004.89

Поступила в редакцию: 14.09.2020
Исправленный вариант: 16.01.2021
Принята в печать: 18.01.2021

DOI: 10.20537/2076-7633-2021-13-2-429-435