RUS  ENG
Полная версия
ЖУРНАЛЫ // Препринты Института прикладной математики им. М. В. Келдыша РАН // Архив

Препринты ИПМ им. М. В. Келдыша, 2022, 036, 14 стр. (Mi ipmp3062)

Эта публикация цитируется в 2 статьях

Машинное обучение с подкреплением для решения задач математического программирования

И. А. Белозеров, В. А. Судаков


Аннотация: В работе рассматриваются современные подходы к поиску рациональных решений в задачах смешанного целочисленного линейного программирования, как сгенерированных со случайными данными, так и из реальной практики. Основной упор сделан на то, каким образом можно осуществить процесс поиска решения задач дискретной оптимизации, используя концепцию обучения с подкреплением; какие техники возможно применить, чтобы улучшить скорость и качество работы. Были разработаны три основных варианта алгоритма, с помощью API библиотеки Ray, а также окружения – библиотеки Gym. Приводится сравнение результатов разработанного решателя с библиотекой OR-Tools. Лучшая модель может быть использована в качестве решателя для оптимизационных задач большой размерности, кроме того, данная концепция применима к другим задачам комбинаторного характера с изменением кода окружения и алгоритма интеллектуального агента.

Ключевые слова: машинное обучение с подкреплением, окружение, нейронные сети, смешанное целочисленное программирование, дискретная оптимизация Ray, Gym.

DOI: 10.20948/prepr-2022-36



© МИАН, 2024