В. И. Петренко, “Классификация задач мультиагентного обучения с подкреплением”, Известия Кабардино-Балкарского научного центра РАН, 2021, выпуск 3,страницы 32

ТЕХНИЧЕСКИЕ НАУКИ

Классификация задач мультиагентного обучения с подкреплением

В. И. Петренко

Федеральное государственное автономное образовательное учреждение высшего образования «Северо-Кавказский федеральный университет», 355017, Ставропольский край, г. Ставрополь, ул. Пушкина, 1

Аннотация: C появлением глубокого одноагентного обучения с подкреплением (ООП) мультиагентное обучение с подкреплением (МОП) получило новый толчок к развитию в виде глубокого МОП (ГМОП). Активное развитие методов данной области в течение последних нескольких лет актуализирует вопросы их систематизации и классификации. Существующие работы в качестве признаков классификации используют механизмы, применяемые в соответствующих методах ГМОП. Однако применимость того или иного метода определяется не только классом метода, но и классом задачи МОП. Целью данной работы являются формализация и классификация задач МОП. Для достижения цели выполнены математическая формализация и обобщение существующих классификаций задач ООП. Рассмотрены и математически формализованы особенности, возникающие при переходе от задачи ООП к задаче МОП. Выделены существенные признаки и выполнена классификация задач МОП на основе теоретико-множественного подхода. Использование теоретико-множественного подхода позволило выявить классы задач МОП, обобщаемые в других подобных работах, однако обладающие специфическими свойствами, что может быть использовано при разработке более эффективных методов решения таких задач МОП. Ожидается, что предложенные формализм и классификация задач МОП будут полезны исследователям в качестве инструмента постановки задачи и определения места исследования в общей структуре методов и задач МОП, а также разработчикам для обоснованного выбора методов МОП на основе класса решаемой задачи.

Ключевые слова: мультиагентное обучение с подкреплением, мультиагентные системы, классификация.

УДК: 004.852

MSC: 68T05

Поступила в редакцию: 27.05.2021

DOI: 10.35330/1991-6639-2021-3-101-32-44