RUS  ENG
Полная версия
ЖУРНАЛЫ // Проблемы передачи информации // Архив

Пробл. передачи информ., 2020, том 56, выпуск 3, страницы 86–111 (Mi ppi2323)

Эта публикация цитируется в 9 статьях

Теория автоматов

Гауссовский двурукий бандит: предельное описание

А. В. Колногоров

Новгородский государственный университет им. Ярослава Мудрого, кафедра прикладной математики и информатики

Аннотация: Для гауссовского двурукого бандита, который возникает при анализе пакетной обработки данных, изучается предельное поведение минимаксного риска, если горизонт управления $N$ неограниченно растет. Минимаксный риск ищется как байесовский, вычисленный относительно наихудшего априорного распределения. Показано, что наиболее высокие требования к управлению предъявляются в области “близких” распределений, где математические ожидания доходов различаются на величину порядка $N^{-1/2}$. В области “близких” распределений получены рекуррентное интегро-разностное уравнение для нахождения байесовского риска относительно наихудшего априорного распределения в инвариантной форме с горизонтом управления, равным единице, и дифференциальное уравнение в частных производных второго порядка в предельном случае. Результаты позволяют оценить качество пакетной обработки. Например, минимаксный риск, соответствующий пакетной обработке данных, разбитых на $50$ пакетов, может быть лишь на $2\%$ выше своего предельного значения, если число пакетов неограниченно растет. В случае бернуллиевского двурукого бандита показано, что оптимальная обработка данных по одному не является более эффективной, чем пакетная, если $N$ неограниченно растет.

Ключевые слова: гауссовский двурукий бандит, минимаксный и байесовский подходы, пакетная обработка, асимптотическая минимаксная теорема.

УДК: 621.391.1 : 519.713 : 517.977.5

Поступила в редакцию: 06.04.2020
После переработки: 02.06.2020
Принята к печати: 02.06.2020

DOI: 10.31857/S0555292320030055


 Англоязычная версия: Problems of Information Transmission, 2020, 56:3, 278–301

Реферативные базы данных:


© МИАН, 2024