RUS  ENG
Полная версия
ЖУРНАЛЫ // Компьютерные исследования и моделирование // Архив

Компьютерные исследования и моделирование, 2021, том 13, выпуск 2, страницы 405–415 (Mi crm891)

СПЕЦИАЛЬНЫЙ ВЫПУСК
ОБРАБОТКА ВИДЕОИЗОБРАЖЕНИЙ В ИНТЕЛЛЕКТУАЛЬНЫХ ТРАНСПОРТНЫХ СИСТЕМАХ

Approaches for image processing in the decision support system of the center for automated recording of administrative offenses of the road traffic

[Подходы к обработке изображений в системе поддержки принятия решений центра автоматизированной фиксации административных правонарушений дорожного движения]

R. N. Minnikhanovab, I. V. Anikinb, M. V. Dagaevaba, T. I. Asliamovab, T. E. Bolshakovba

a “Road Safety” State Company, 5 Orenburgskij trakt, Kazan, 420059, Russia
b Kazan National Research Technical University named after A. N. Tupolev

Аннотация: В статье предлагается ряд подходов к обработке изображений в системе поддержки принятия решений (СППР) центра автоматизированной фиксации административных правонарушений дорожного движения (ЦАФАП). Основной задачей данной СППР является помощь человеку-оператору в получении точной информации о государственном регистрационном знаке (ГРЗ) и модели транспортного средства (ТС) на основании изображений, полученных с комплексов фотовидеофиксации (ФВФ). В статье предложены подходы к распознаванию ГРЗ и марки/модели ТС на изображении, основанные на современных нейросетевых моделях. Для распознавания ГРЗ использована нейросетевая модель LPRNet с дополнительно введенным Spatial Transformer Layer для предобработки изображения. Для автоматического определения марки/модели ТС на изображении использована нейросетевая архитектура ResNeXt-101-32x8d. Предложен подход к формированию обучающей выборки для нейросетевой модели распознавания ГРЗ, основанный на методах компьютерного зрения и алгоритмах машинного обучения. В данном подходе использован алгоритм SIFT для нахождения ключевых точек изображения с ГРЗ и вычисления их дескрипторов, а для удаления точек-выбросов использован алгоритм DBSCAN. Точность распознавания ГРЗ на тестовой выборке составила 96 %. Предложен подход к повышению производительности процедур дообучения и распознавания марки/модели ТС, основанный на использовании новой архитектуры сверточной нейронной сети с «заморозкой» весовых коэффициентов сверточных слоев, дополнительным сверточным слоем распараллеливания процесса классификации и множеством бинарных классификаторов на выходе. Применение новой архитектуры позволило на несколько порядков уменьшить время дообучения нейросетевой модели распознавания марки/модели ТС с итоговой точностью классификации, близкой к 99 %. Предложенные подходы были апробированы и внедрены в СППР ЦАФАП Республики Татарстан.

Ключевые слова: система поддержки принятия решений, изображение, компьютерное зрение, нейронные сети.

УДК: 004.89

Поступила в редакцию: 14.09.2020
Исправленный вариант: 29.01.2021
Принята в печать: 01.02.2021

Язык публикации: английский

DOI: 10.20537/2076-7633-2021-13-2-405-415



© МИАН, 2024