RUS  ENG
Полная версия
ЖУРНАЛЫ // Вестник Санкт-Петербургского университета. Серия 10. Прикладная математика. Информатика. Процессы управления // Архив

Вестн. С.-Петербург. ун-та. Сер. 10. Прикл. матем. Информ. Проц. упр., 2023, том 19, выпуск 3, страницы 391–402 (Mi vspui591)

Информатика

Microgrid control for renewable energy sources based on deep reinforcement learning and numerical optimization approaches

[Управление микроэнергосистемой с возобновляемыми источниками энергии на основе глубокого обучения с подкреплением и подходов численной оптимизации]

A. Yu. Zhadan, H. Wu, P. S. Kudin, Y. Zhang, O. L. Petrosian

St. Petersburg State University, 7–9, Universitetskaya nab., St. Petersburg, 199034, Russian Federation

Аннотация: Оптимальное планирование работы аккумуляторной системы хранения энергии играет важную роль в распределенной энергетической системе. Как метод, основанный на данных, глубокое обучение с подкреплением не требует наличия системных знаний о динамической системе, позволяя найти оптимальное решение для нелинейной задачи оптимизации. В данном исследовании финансовые затраты на потребление энергии снижены за счет планирования энергии аккумуляторов с использованием метода глубокого обучения с подкреплением (RL). Обучение с подкреплением может адаптироваться к изменениям параметров оборудования и шумам в данных, в то время как смешанно-целочисленное линейное программирование (MILP) требует высокой точности прогнозирования выработки и спроса на электроэнергию, точных параметров оборудования для достижения хорошей производительности, а также больших вычислительных затрат для крупномасштабных промышленных приложений. Исходя из этого, можно предположить, что решение на основе глубокого RL способно превзойти классическую детерминированную модель оптимизации MILP. Сравниваются четыре современных RL-алгоритма для задачи управления аккумуляторной электростанцией: PPO, A2C, SAC, TD3. Согласно результатам моделирования, TD3 показывает наилучшие результаты, превосходя MILP на 5 % по экономии средств, а время решения задачи сокращается примерно в 3 раза.

Ключевые слова: обучение с подкреплением, система управления энергией, распределенная энергетическая система, численная оптимизация.

УДК: 519.217

MSC: 90C40

Поступила: 26 мая 2023 г.
Принята к печати: 8 июня 2023 г.

Язык публикации: английский

DOI: 10.21638/11701/spbu10.2023.307



© МИАН, 2024