RUS  ENG
Полная версия
ЖУРНАЛЫ // Известия Кабардино-Балкарского научного центра РАН // Архив

Известия Кабардино-Балкарского научного центра РАН, 2025, том 27, выпуск 3, страницы 39–54 (Mi izkab942)

Системный анализ, управление и обработка информации

Разработка системы управления курсом беспилотного автомобиля на основе обучения с подкреплением

А. Е. Ушаковa, М. М. Стебулянинa, М. А. Шереужевa, Ф. В. Девяткинba

a Московский государственный технологический университет «СТАНКИН», 127055, Россия, Москва, Вадковский пер., 1
b Московский государственный технический университет имени Н. Э. Баумана, 105005, Россия, Москва, 2-я Бауманская улица, 5

Аннотация: Рост развития автономного транспорта связан с повышением безопасности на дорогах, снижением столкновений и повышением эффективности логистических операций. На безопасность также влияет такой фактор, как усложнение дорожных условий и задач, связанных с навигацией и управлением автомобиля, и поэтому традиционные алгоритмы управления оказываются недостаточно качественными и эффективными. Цель исследования – разработка интеллектуальной системы, которая позволяет автономному транспортному средству самостоятельно управлять курсом движения автономного агента (модель автомобиля), который обучается навигации и следованию по заданному курсу с помощью обучения с подкреплением на основе взаимодействия с имитационной средой методом актер-критик. Материалы и методы. В данной работе для реализации и обучения модели с подкреплением использовалась библиотека Stable-Baselines3 (SB3), построенная на фреймворке PyTorch. В качестве среды обучения использовался симулятор DonkayCar. Для повышения скорости и эффективности обучения был применен алгоритм шумоподавляющего автокодера для выделения зоны интереса. Результаты. В рамках исследования была проведена серия сравнительных тестов, направленных на оценку влияния различных параметров эффективности обучения модели – ограничение скорости, ограничение угла поворота колес, ширины допустимого отклонения, непрерывности движения, коэффициента дисконтирования, частоты отрисовки кадров. Выводы. Результаты исследования позволяют сделать выводы о потенциале использования обучения с подкреплением в сфере автономного транспорта, включая необходимость дообучения модели на реальных данных, перспективы масштабирования на транспортные средства различного класса, ограничения, связанные с вычислительными ресурсами и необходимостью безопасной верификации поведения.

Ключевые слова: обучение с подкреплением, беспилотный автомобиль, Q-learning, DQN (Deep Q-Network), актер-критик, имитационное моделирование, интеллектуальная система, симуляционная среда, устойчивость обучения

УДК: 004.8+629.113

MSC: 68T05

Поступила в редакцию: 19.05.2025
Исправленный вариант: 28.05.2025
Принята в печать: 02.06.2025

DOI: 10.35330/1991-6639-2025-27-3-39-54



Реферативные базы данных:


© МИАН, 2025