RUS  ENG
Полная версия
ЖУРНАЛЫ // Известия Иркутского государственного университета. Серия «Математика» // Архив

Известия Иркутского государственного университета. Серия Математика, 2021, том 38, страницы 65–83 (Mi iigum469)

Алгебро-логические методы в информатике и искусственный интеллект

Глубокое обучение адаптивных систем управления на основе логико-вероятностного подхода

А. В. Демин

Институт систем информатики им. А. П. Ершова СО РАН, Новосибирск, Российская Федерация

Аннотация: Проблема автоматического выделения подцелей в настоящее время является одной из наиболее актуальных в задачах адаптивного управления, в частности в задачах обучения с подкреплением (Reinforcement Learning). В данной работе предложен логико-вероятностный подход к построению адаптивных обучаемых систем управления, способный обнаруживать глубокие неявные подцели. Подход использует идеи нейрофизиологической теории функциональных систем для организации схемы управления, и логико-вероятностные методы машинного обучения для обучения правил работы системы и выявления подцелей. Работоспособность предложенного подхода демонстрируется на примере решения трехэтапной задачи фуражирования, содержащей две вложенные неявные подцели.

Ключевые слова: система управления, машинное обучение, обнаружение закономерностей, обучение с подкреплением.

УДК: 004.85

MSC: 22E05

Поступила в редакцию: 27.10.2021

DOI: 10.26516/1997-7670.2021.38.65



Реферативные базы данных:


© МИАН, 2024