Аннотация:
В настоящее время подходы к детектированию объектов дорожной сцены на основе свёрточных нейронных сетей достигли приемлемого уровня для использования их в задачах автономного управления транспортным средством и ADAS системах. Однако как правило, лучшие современные сетевые архитектуры достаточно тяжеловесны и не могут быть использованы в системах реального времени. В связи с этим наиболее остро стоит проблема ускорения сетей и нахождения оптимального баланса между скоростью и качеством их работы. В данной работе предложен метод облегчения архитектуры Deformable Convolutional Network с базовой сетью ResNet, дающий трехкратное увеличение скорости прямого прохода. При этом качество детектирования объектов дорожной сцены уменьшается не столь существенно. Кроме того, в работе приведено сравнение качества работы сети данной архитектуры при обучении на различных открытых наборах данных – BDD и MS-COCO.