RUS  ENG
Полная версия
ЖУРНАЛЫ // Компьютерные исследования и моделирование // Архив

Компьютерные исследования и моделирование, 2024, том 16, выпуск 1, страницы 137–146 (Mi crm1154)

СПЕЦИАЛЬНЫЙ ВЫПУСК

Improving the quality of route generation in SUMO based on data from detectors using reinforcement learning

[Повышение качества генерации маршрутов в SUMO на основе данных с детекторов с использованием обучения с подкреплением]

I. A. Saleneka, Ya. A. Seliverstovb, S. A. Seliverstovb, E. A. Sofronovac

a St. Petersburg Institute of Informatics and Automation of the Russian Academy of Sciences, 39 14-th Line VO, St. Petersburg, 199178, Russia
b Solomenko Institute of Transport Problems of the Russian Academy of Sciences, 13 12-th Line VO, St. Petersburg, 199178, Russia
c Federal Research Center “Computer Science and Control” of the Russian Academy of Sciences, 44/2 Vavilova st., Moscow, 119333, Russia

Аннотация: Данная работа предлагает новый подход к построению высокоточных маршрутов на основе данных от транспортных детекторов в пакете моделирования трафика SUMO. Существующие инструменты, такие как flowrouter и routeSampler, имеют ряд недостатков, таких как отсутствие взаимодействия с сетью в процессе построения маршрутов. Наш rlRouter использует мультиагентное обучение с подкреплением (MARL), где агенты — это входящие полосы движения, а окружающая среда — дорожная сеть. Добавляя в сеть транспортные средства с определенными маршрутами, агенты получают вознаграждение за сопоставление данных с детекторами транспорта. В качестве алгоритма мультиагентного обучения с подкреплением использовался DQN с разделением параметров между агентами и LSTM-слоем для обработки последовательных данных.
Поскольку rlRouter обучается внутри симуляции SUMO, он может лучше восстанавливать маршруты, принимая во внимание взаимодействие транспортных средств внутри сети друг с другом и с сетевой инфраструктурой. Мы смоделировали различные дорожные ситуации на трех разных перекрестках, чтобы сравнить производительность маршрутизаторов SUMO с rlRouter. Мы использовали среднюю абсолютную ошибку (MAE) в качестве меры отклонения кумулятивных данных детекторов и от данных маршрутов. rlRouter позволил добиться высокого соответствия данным с детекторов. Мы также обнаружили, что, максимизируя вознаграждение за соответствие детекторам, результирующие маршруты также становятся ближе к реальным. Несмотря на то, что маршруты, восстановленные с помощью rlRouter, превосходят маршруты, полученные с помощью инструментов SUMO, они не полностью соответствуют реальным из-за естественных ограничений петлевых детекторов. Чтобы обеспечить более правдоподобные маршруты, необходимо оборудовать перекрестки другими видами транспортных счетчиков, например, детекторами-камерами.

Ключевые слова: транспортное моделирование, мультиагентное обучение с подкреплением, интеллектуальные транспортные системы

УДК: 519.876.5, 519.179.2

Поступила в редакцию: 21.11.2023
Принята в печать: 21.12.2023

Язык публикации: английский

DOI: 10.20537/2076-7633-2024-16-1-137-146



© МИАН, 2024