Аннотация:
C появлением глубокого одноагентного обучения с подкреплением (ООП) мультиагентное обучение с подкреплением (МОП) получило новый толчок к развитию в виде глубокого МОП (ГМОП).
Активное развитие методов данной области в течение последних нескольких лет актуализирует
вопросы их систематизации и классификации. Существующие работы в качестве признаков
классификации используют механизмы, применяемые в соответствующих методах ГМОП. Однако применимость того или иного метода определяется не только классом метода, но и классом
задачи МОП. Целью данной работы являются формализация и классификация задач МОП. Для
достижения цели выполнены математическая формализация и обобщение существующих классификаций задач ООП. Рассмотрены и математически формализованы особенности, возникающие при переходе от задачи ООП к задаче МОП. Выделены существенные признаки и выполнена
классификация задач МОП на основе теоретико-множественного подхода. Использование теоретико-множественного подхода позволило выявить классы задач МОП, обобщаемые в других
подобных работах, однако обладающие специфическими свойствами, что может быть использовано при разработке более эффективных методов решения таких задач МОП. Ожидается, что
предложенные формализм и классификация задач МОП будут полезны исследователям в качестве инструмента постановки задачи и определения места исследования в общей структуре методов и задач МОП, а также разработчикам для обоснованного выбора методов МОП на основе
класса решаемой задачи.
Ключевые слова:мультиагентное обучение с подкреплением, мультиагентные системы,
классификация.