RUS  ENG
Full version
JOURNALS // Preprints of the Keldysh Institute of Applied Mathematics

Keldysh Institute preprints, 2024, 039, 13 pp. (Mi ipmp3249)

Reinforcement learning model for enterprise fleet optimization
D. N. Shmyglev, V. A. Sudakov

References

1. V. I. Mudrov, Zadacha o kommivoyazhere, Znanie, M., 1969, 62 pp.
2. M. Stutzleb T. Dorigo, Ant Colony Optimization, MIT Press, 2004, 305 pp.  mathscinet  zmath
3. D. Saimon, Algoritmy evolyutsionnoi optimizatsii, DMK Press, M., 2020, 940 pp.
4. R. S. Satton, A. G. Barto, Obuchenie s podkrepleniem: Vvedenie, per. s angl. A. A. Slinkina, 2-e izd., DMK Press, M., 2020, 552 pp.
5. A. L.C. Ottoni, E. G. Nepomuceno, M. S.d. Oliveira et al, “Reinforcement learning for the traveling salesman problem with refueling”, Complex Intell. Syst., 2022, no. 8, 2001–2015  crossref
6. E. V. Sokolov, Yu. V. Gugnin, “Model optimizatsii avtoparka transportnoi kompanii”, Ekonomika i upravlenie: problemy, resheniya, 2012, no. 05, 56–60
7. J. Schulman, F. Wolski, P. Dhariwal, A. Radford, O. Klimov, Proximal policy optimization algorithms, 2017, arXiv: 1707.06347  crossref


© Steklov Math. Inst. of RAS, 2026