RUS  ENG
Полная версия
ЖУРНАЛЫ // Математическая теория игр и её приложения // Архив

МТИП, 2017, том 9, выпуск 4, страницы 69–87 (Mi mgta209)

Эта публикация цитируется в 3 статьях

Модель принятия решений при наличии экспертов как модифицированная задача о многоруком бандите

Дмитрий С. Смирнов, Екатерина В. Громова

Санкт-Петербургский государственный университет, 199034, Санкт-Петербург, Университетская наб., 7-9

Аннотация: В работе сформулирована модификация задачи о многоруком бандите, позволяющая игроку в процессе принятия решения использовать так называемые экспертные подсказки. Под игроком в данной задаче понимается некоторая автоматизированная система, использующая определенную стратегию (алгоритм) для принятия решения в условиях неопределенности. Подход развит для случая $m$ экспертов. Предложена модификация известного алгоритма UCB1 для решения задачи о многоруком бандите. Приведены результаты численного эксперимента, показывающие, каким образом экспертные подсказки влияют на величину выигрыша игрока.

Ключевые слова: задача о многоруком бандите, принятие решений, методы оптимизации, алгоритмы машинного обучения.

УДК: 519.81, 004.021, 004.942
ББК: 22.18



© МИАН, 2024