Аннотация:
Рассматривается задача о двуруком бандите в приложении к обработке большого числа $N$ данных, допускающих использование для этого двух альтернативных методов. Предложена стратегия, которая на начальных этапах, числом не больше $r-1$, сравнивает методы, а на заключительном этапе применяет только лучший по результатам сравнения метод. Найдены асимптотически оптимальные параметры стратегии и установлено, что порядок минимаксного риска определяется величиной $N^\alpha$, где $\alpha=2^{r-1}/(2^r-1)$. При параллельной обработке полное время работы определяется количеством этапов $r$, а не числом данных $N$.
УДК:
621.391.1+503.5
Поступила в редакцию: 22.03.2011 После переработки: 19.09.2011