|
СЕМИНАРЫ |
|
Робастное параллельное управление в случайной среде (задаче о двуруком бандите) А. В. Колногоров Новгородский государственный университет |
|||
Аннотация: Задача о поведении в случайной среде, известная также как задача о двуруком бандите, рассматривается в робастной (минимаксной) постановке. Минимаксные стратегия и риск ищутся как байесовские, соответствующие наихудшему априорному распределению. Для сред с доходами, имеющими нормальные распределения с единичной дисперсией и математическими ожиданиями, зависящими только от выбираемых вариантов, это распределение может быть выбрано симметрическим и асимптотически однородным. Предложена стратегия параллельного управления, которая обеспечивает управление, сколь угодно близкое к оптимальному. Получено инвариантное рекуррентное уравнение для нахождения минимаксных стратегии и риска методом динамического программирования. Это позволяет улучшить известные оценки минимаксного риска Фогеля (W. Vogel). Численный анализ показывает, что стратегия хорошо функционирует в средах с распределениями, отличающимися от нормальных, например, в бинарных. |