RUS  ENG
Полная версия
ЖУРНАЛЫ // Информационные технологии и вычислительные системы // Архив

ИТиВС, 2019, выпуск 3, страницы 57–65 (Mi itvs353)

РАСПОЗНАВАНИЕ ОБРАЗОВ

Об ускорении архитектуры сверточной нейронной сети на базе ResNet в задаче распознавания объектов дорожной сцены

М. Г. Лобановa, Д. Л. Шоломовbc

a Московский государственный университет им. М.В. Ломоносова, г. Москва, Россия
b Институт проблем передачи информации им. А.А. Харкевича Российской академии наук, г. Москва, Россия
c Национальный исследовательский технологический университет ”МИСиС”, г. Москва, Россия

Аннотация: В настоящее время подходы к детектированию объектов дорожной сцены на основе свёрточных нейронных сетей достигли приемлемого уровня для использования их в задачах автономного управления транспортным средством и ADAS системах. Однако как правило, лучшие современные сетевые архитектуры достаточно тяжеловесны и не могут быть использованы в системах реального времени. В связи с этим наиболее остро стоит проблема ускорения сетей и нахождения оптимального баланса между скоростью и качеством их работы. В данной работе предложен метод облегчения архитектуры Deformable Convolutional Network с базовой сетью ResNet, дающий трехкратное увеличение скорости прямого прохода. При этом качество детектирования объектов дорожной сцены уменьшается не столь существенно. Кроме того, в работе приведено сравнение качества работы сети данной архитектуры при обучении на различных открытых наборах данных – BDD и MS-COCO.

Ключевые слова: детектор объектов, объекты дорожной сцены, deformable convolutional network, ResNet, ADAS системы, ускорение сверточной сети, BDD, MS-COCO, распознавание пешеходов, распознавание машин.

DOI: 10.14357/20718632190305



© МИАН, 2024