RUS  ENG
Полная версия
ЖУРНАЛЫ // Препринты Института прикладной математики им. М. В. Келдыша РАН

Препринты ИПМ им. М. В. Келдыша, 2024, 039, 13 стр. (Mi ipmp3249)

Модель обучения с подкреплением для оптимизации автопарка предприятия
Д. Н. Шмыглёв, В. А. Судаков

Список литературы

1. В. И. Мудров, Задача о коммивояжере, Знание, М., 1969, 62 с.
2. M. Stutzleб T. Dorigo, Ant Colony Optimization, MIT Press, 2004, 305 с.  mathscinet  zmath
3. Д. Саймон, Алгоритмы эволюционной оптимизации, ДМК Пресс, М., 2020, 940 с.
4. Р. С. Саттон, А. Г. Барто, Обучение с подкреплением: Введение, пер. с англ. А. А. Слинкина, 2-е изд., ДМК Пресс, М., 2020, 552 с.
5. A. L.C. Ottoni, E. G. Nepomuceno, M. S.d. Oliveira et al, “Reinforcement learning for the traveling salesman problem with refueling”, Complex Intell. Syst., 2022, no. 8, 2001–2015  crossref
6. Е. В. Соколов, Ю. В. Гугнин, “Модель оптимизации автопарка транспортной компании”, Экономика и управление: проблемы, решения, 2012, № 05, 56–60
7. J. Schulman, F. Wolski, P. Dhariwal, A. Radford, O. Klimov, Proximal policy optimization algorithms, 2017, arXiv: 1707.06347  crossref


© МИАН, 2025