СПЕЦИАЛЬНЫЙ ВЫПУСК
Improving the quality of route generation in SUMO based on data from detectors using reinforcement learning
[Повышение качества генерации маршрутов в SUMO на основе данных с детекторов с использованием обучения с подкреплением]
I. A. Saleneka,
Ya. A. Seliverstovb,
S. A. Seliverstovb,
E. A. Sofronovac a St. Petersburg Institute of Informatics and Automation of the Russian Academy of Sciences,
39 14-th Line VO, St. Petersburg, 199178, Russia
b Solomenko Institute of Transport Problems of the Russian Academy of Sciences,
13 12-th Line VO, St. Petersburg, 199178, Russia
c Federal Research Center “Computer Science and Control” of the Russian Academy of Sciences,
44/2 Vavilova st., Moscow, 119333, Russia
Аннотация:
Данная работа предлагает новый подход к построению высокоточных маршрутов на основе данных от транспортных детекторов в пакете моделирования трафика SUMO. Существующие инструменты, такие как
flowrouter и
routeSampler, имеют ряд недостатков, таких как отсутствие взаимодействия с сетью в процессе построения маршрутов. Наш
rlRouter использует мультиагентное обучение с подкреплением (MARL), где агенты — это входящие полосы движения, а окружающая среда — дорожная сеть. Добавляя в сеть транспортные средства с определенными маршрутами, агенты получают вознаграждение за сопоставление данных с детекторами транспорта. В качестве алгоритма мультиагентного обучения с подкреплением использовался DQN с разделением параметров между агентами и LSTM-слоем для обработки последовательных данных.
Поскольку
rlRouter обучается внутри симуляции SUMO, он может лучше восстанавливать маршруты, принимая во внимание взаимодействие транспортных средств внутри сети друг с другом и с сетевой инфраструктурой. Мы смоделировали различные дорожные ситуации на трех разных перекрестках, чтобы сравнить производительность маршрутизаторов SUMO с
rlRouter. Мы использовали среднюю абсолютную ошибку (MAE) в качестве меры отклонения кумулятивных данных детекторов и от данных маршрутов.
rlRouter позволил добиться высокого соответствия данным с детекторов. Мы также обнаружили, что, максимизируя вознаграждение за соответствие детекторам, результирующие маршруты также становятся ближе к реальным. Несмотря на то, что маршруты, восстановленные с помощью
rlRouter, превосходят маршруты, полученные с помощью инструментов SUMO, они не полностью соответствуют реальным из-за естественных ограничений петлевых детекторов. Чтобы обеспечить более правдоподобные маршруты, необходимо оборудовать перекрестки другими видами транспортных счетчиков, например, детекторами-камерами.
Ключевые слова:
транспортное моделирование, мультиагентное обучение с подкреплением, интеллектуальные транспортные системы
УДК:
519.876.5,
519.179.2 Поступила в редакцию: 21.11.2023
Принята в печать: 21.12.2023
Язык публикации: английский
DOI:
10.20537/2076-7633-2024-16-1-137-146