Ya. M. Hanafi, V. P. Shkodyrev, “Reinforcement learning for industrial manufacturing control system”, Информатика, телекоммуникации и управление, 2021, том 14, выпуск 1,страницы 60

Системный анализ и управление

Reinforcement learning for industrial manufacturing control system

[Усиление обучения для системы управления промышленным производством]

Ya. M. Hanafi, V. P. Shkodyrev

Peter the Great St. Petersburg Polytechnic University

Аннотация: Поставленная задача представляет общий случай оптимального управления динамической, потенциально стохастической и частично наблюдаемой системой, для которой модель не обязательно доступна. В статье представлен анализ недостатков классических подходов теории управления и предлагается новый модифицированный алгоритм машинного обучения с подкреплением. Теория управления – область, которая изучалась очень долгое время и которая касается поведения динамических систем и того, как на нее влиять. Среди наиболее известных примеров – LQG (Линейно-квадратичное гауссовское управление) или ПИД-контроллеры. Большинство существующих подходов предполагают (аналитическое) знание динамической системы, и одним из ограничений является необходимость иметь возможность освободиться от априорных моделей. Мы концентрируем внимание на преимуществах использования моделей машинного обучения с подкреплением как перспективной стратегии управления сложными динамическими системами в условиях неопределенности.

Ключевые слова: усиление обучения, мультиагентная система, нефтепереработка, уравнения Беллмана, динамическое программирование.

УДК: 004

Поступила в редакцию: 07.03.2021

Язык публикации: английский

DOI: 10.18721/JCSTCS.14106