RUS  ENG
Полная версия
ЖУРНАЛЫ // Автоматика и телемеханика // Архив

Автомат. и телемех., 2012, выпуск 4, страницы 114–130 (Mi at3793)

Эта публикация цитируется в 15 статьях

Робастные и адаптивные системы

Робастное параллельное управление в случайной среде (задаче о двуруком бандите)

А. В. Колногоров

Новгородский государственный университет им. Ярослава Мудрого

Аннотация: Задача о поведении в случайной среде, известная как задача о двуруком бандите, рассматривается в робастной (минимаксной) постановке. Предложена стратегия параллельного управления, которая в средах с нормально распределенными доходами, имеющими единичные дисперсии, обеспечивает управление, сколь угодно близкое к оптимальному. Получено инвариантное рекуррентное уравнение для нахождения минимаксных стратегии и риска, которые ищутся как байесовские, соответствующие наихудшему априорному распределению. Это позволяет улучшить известные оценки минимаксного риска Фогеля (W. Vogel). Численный анализ показывает, что стратегия хорошо функционирует в средах с распределениями, отличающимися от нормальных (например, бинарных).

Статья представлена к публикации членом редколлегии: А. В. Назин

Поступила в редакцию: 24.11.2010


 Англоязычная версия: Automation and Remote Control, 2012, 73:4, 689–701

Реферативные базы данных:


© МИАН, 2024