|
СЕМИНАРЫ |
Семинар лаборатории ПреМоЛаб
|
|||
|
Управление в случайной среде: задача о двуруком бандите А. В. Колногоров Новгородский государственный университет им. Ярослава Мудрого |
|||
Аннотация: Рассматривается управление обработкой больших объемов данных, если для обработки имеются два альтернативных метода с различными априори неизвестными эффективностями. Требуется определить более эффективный метод и обеспечить его преимущественное применение. С использованием параллельной обработки это может быть выполнено за сравнительно небольшое число этапов, причем практически без потери качества управления, т.е. без увеличения минимаксного риска. Решение задачи ищется с помощью основной теоремы теории игр, согласно которой минимаксные стратегия и риск могут быть найдены как байесовские, соответствующие наихудшему априорному распределению. Для вычисления байесовских стратегии и риска относительно наихудшего априорного распределения получено инвариантное интегро-разностное уравнение. Если горизонт управления неограниченно растет, интегро-разностное уравнение превращается в дифференциальное уравнение в частных производных второго порядка. Численные эксперименты показывают близость решений инвариантного интегро-разностного и дифференциального уравнений. |