Аннотация:
В работе сформулирована модификация задачи о многоруком бандите, позволяющая игроку в процессе принятия решения использовать так называемые экспертные подсказки. Под игроком в данной задаче понимается некоторая автоматизированная система, использующая определенную стратегию (алгоритм) для принятия решения в условиях неопределенности. Подход развит для случая $m$ экспертов. Предложена модификация известного алгоритма UCB1 для решения задачи о многоруком бандите. Приведены результаты численного эксперимента, показывающие, каким образом экспертные подсказки влияют на величину выигрыша игрока.
Ключевые слова:задача о многоруком бандите, принятие решений, методы оптимизации, алгоритмы машинного обучения.