RUS  ENG
Полная версия
ЖУРНАЛЫ // Вестник Южно-Уральского государственного университета. Серия «Математическое моделирование и программирование» // Архив

Вестн. ЮУрГУ. Сер. Матем. моделирование и программирование, 2024, том 17, выпуск 1, страницы 27–36 (Mi vyuru709)

Математическое моделирование

Invariant description of control in a Gaussian one-armed bandit problem

[Инвариантное описание управления в задаче о гауссовском одноруком бандите]

A. V. Kolnogorov

Yaroslav-the-Wise Novgorod State University, Veliky Novgorod, Russian Federation

Аннотация: Рассматривается задача об одноруком бандите в приложении к пакетной обработке данных, если имеются два альтернативных метода обработки с разной эффективностью, причем эффективность второго метода априори неизвестна. В процессе обработки необходимо определить наиболее эффективный метод и обеспечить его преимущественное использование. Обработка выполняется пакетами, поэтому распределение доходов является гауссовским. Мы рассматриваем случай априори неизвестных математического ожидания и дисперсии одношагового дохода, соответствующих второму действию. Этот случай описывает ситуацию, когда сами пакеты и их количество имеют умеренные или небольшие объемы. Получены рекуррентные уравнения для вычисления байесовского риска и функции потерь, которые затем представлены в инвариантном виде с горизонтом управления, равным единице. Это позволяет получить оценки байесовского и минимаксного рисков, которые справедливы для всех горизонтов управления, кратных количеству обработанных пакетов.

Ключевые слова: однорукий бандит, пакетная обработка, байесовский и минимаксный подходы, инвариантное описание.

УДК: 519.244, 519.83

MSC: 62C10, 62L05, 91A35

Поступила в редакцию: 22.11.2023

Язык публикации: английский

DOI: 10.14529/mmp240103



© МИАН, 2024