Аннотация:
Рост развития автономного транспорта связан с повышением безопасности на
дорогах, снижением столкновений и повышением эффективности логистических операций. На
безопасность также влияет такой фактор, как усложнение дорожных условий и задач, связанных с
навигацией и управлением автомобиля, и поэтому традиционные алгоритмы управления оказываются
недостаточно качественными и эффективными. Цель исследования – разработка интеллектуальной
системы, которая позволяет автономному транспортному средству самостоятельно управлять курсом
движения автономного агента (модель автомобиля), который обучается навигации и следованию
по заданному курсу с помощью обучения с подкреплением на основе взаимодействия с имитационной
средой методом актер-критик. Материалы и методы. В данной работе для реализации и обучения
модели с подкреплением использовалась библиотека Stable-Baselines3 (SB3), построенная на фреймворке
PyTorch. В качестве среды обучения использовался симулятор DonkayCar. Для повышения скорости и
эффективности обучения был применен алгоритм шумоподавляющего автокодера для выделения
зоны интереса. Результаты. В рамках исследования была проведена серия сравнительных тестов,
направленных на оценку влияния различных параметров эффективности обучения модели – ограничение
скорости, ограничение угла поворота колес, ширины допустимого отклонения, непрерывности
движения, коэффициента дисконтирования, частоты отрисовки кадров. Выводы. Результаты
исследования позволяют сделать выводы о потенциале использования обучения с подкреплением в
сфере автономного транспорта, включая необходимость дообучения модели на реальных данных,
перспективы масштабирования на транспортные средства различного класса, ограничения, связанные
с вычислительными ресурсами и необходимостью безопасной верификации поведения.
Ключевые слова:
обучение с подкреплением, беспилотный автомобиль, Q-learning, DQN
(Deep Q-Network), актер-критик, имитационное моделирование, интеллектуальная система,
симуляционная среда, устойчивость обучения