RUS  ENG
Полная версия
ЖУРНАЛЫ // Управление большими системами // Архив

УБС, 2019, выпуск 78, страницы 46–70 (Mi ubs992)

Системный анализ

Формирование оптимального маршрута больших групп интеллектуальных агентов

Д. Ю. Максимов

ФГБУН Институт проблем управления им. В.А. Трапезникова РАН, Москва

Аннотация: В подходе Artificial General Intelligence (Universal AI) интеллект рассматривается как информационный процессор, потребляющий и выдающий информацию, которой и определяется поведение системы. В рамках этого подхода M. Hutter получил способ выбора оптимальной траектории агента в абстрактной среде. Однако этот способ требовал численных оценок вознаграждения при том или ином движении, способ получения которых оставался открытым. Также этот метод не подходит для оценок движения группы агентов. В настоящей работе оценки вознаграждений предоставляются самой средой и предложен способ выбора траектории, который применим для группы агентов. Параллельное выполнение группой интеллектуальных агентов ряда задач, представляется тензорным произведением соответствующих процессов в категории игр Конвея, которая сопоставлена среде и движениям агентов. Оптимальный маршрут группы определяется как игра с наибольшим суммарным выигрышем в этой категории. Выигрыш представлен степенью определенности (видимости) цели агента, т.е. некоторым множеством, а не числом. Доказано, что такое определение выигрыша может быть использовано в категорной конструкции для игр Конвея. В этой категории тензорное произведение является операцией линейной логики. Также линейная логика применяется для выбора целей, которые система может достичь, из всего множества видимых целей. Для этого все множество целей представляется в виде решетки, на которой задана структура линейной логики. Решетка целей в этом случае становится множеством истинностных значений логики. Целям, которые достигаются параллельно, также соответствует тензорное произведение (как и параллельным процессам в среде), но только теперь это произведение элементов решетки целей. Цели выбираются по наибольшей степени истинности того элемента решетки, который соответствует их параллельному достижению. В результате получена формула для оценки наиболее выигрышного маршрута в абстрактной среде для группы агентов.

Ключевые слова: интеллектуальные агенты, выбор маршрута, решетка целей, игровая семантика.

УДК: 004.8, 007.5
ББК: 22.18, 39.17

Поступила в редакцию: 15 ноября 2018 г.
Опубликована: 31 марта 2019 г.

DOI: 10.25728/ubs.2019.78.3



© МИАН, 2024