RUS  ENG
Полная версия
ЖУРНАЛЫ // Теория вероятностей и ее применения // Архив

Теория вероятн. и ее примен., 2003, том 48, выпуск 4, страницы 661–675 (Mi tvp250)

Эта публикация цитируется в 14 статьях

О стохастической оптимальности для линейно-квадратического регулятора

Т. А. Белкинаa, Ю. М. Кабановb, Э. Л. Пресманa

a Центральный экономико-математический институт РАН
b Laboratoire de Mathématiques, Université de Franche-Comté

Аннотация: В работе показывается, что оптимальное на бесконечном интервале времени марковское управление $\widehat u$ в стандартной задаче линейно-квадратического регулятора обладает следующим свойством. Существует такая константа $b_*$, что для любого $b> b_*$ процесс дефекта оптимального управления относительно любого конкурирующего управления, т.е. разность $J_T(\widehat u)- J_T(u)$ между значением квадратического функционала $J_T(\widehat u)$, отвечающим оптимальному на бесконечности управлению, и значением $J_T(u)$, отвечающим конкурирующему управлению $u$, мажорируется на бесконечности функцией $b\ln T$, т.е. функция $b\ln T$ является верхней функцией для любого процесса дефекта. Этот результат в комбинации с примером линейно-квадратического регулятора, в котором при некотором $b>0$ функция $b\ln T$ не является верхней функцией для некоторого процесса дефекта, дает ответ на давно стоящий вопрос о наилучшей весовой функции для чувствительных вероятностных критериев. Приводимая постановка включает так называемую задачу оптимального “ трекинга”.

Ключевые слова: линейно-квадратический регулятор, оптимальность почти наверное, наблюдаемость, управляемость, уравнение Риккати, закон больших чисел для мартингалов, верхние функции, процесс Орнштейна–Уленбека.

Поступила в редакцию: 25.12.2002

DOI: 10.4213/tvp250


 Англоязычная версия: Theory of Probability and its Applications, 2004, 48:4, 592–603

Реферативные базы данных:


© МИАН, 2024