Эта публикация цитируется в
14 статьях
О стохастической оптимальности для линейно-квадратического
регулятора
Т. А. Белкинаa,
Ю. М. Кабановb,
Э. Л. Пресманa a Центральный экономико-математический институт РАН
b Laboratoire de Mathématiques, Université de Franche-Comté
Аннотация:
В работе показывается, что оптимальное на бесконечном интервале времени
марковское управление
$\widehat u$ в стандартной задаче
линейно-квадратического регулятора обладает следующим свойством.
Существует такая константа
$b_*$, что для любого
$b> b_*$ процесс дефекта
оптимального управления относительно любого конкурирующего управления,
т.е. разность
$J_T(\widehat u)- J_T(u)$ между значением квадратического
функционала
$J_T(\widehat u)$, отвечающим оптимальному на бесконечности
управлению, и значением
$J_T(u)$, отвечающим конкурирующему управлению
$u$, мажорируется на бесконечности функцией
$b\ln T$, т.е. функция
$b\ln T$
является верхней функцией для любого процесса дефекта. Этот результат
в комбинации с примером линейно-квадратического регулятора, в котором
при некотором
$b>0$ функция
$b\ln T$ не является верхней функцией для
некоторого процесса дефекта, дает ответ на давно стоящий вопрос о
наилучшей весовой функции для чувствительных вероятностных критериев.
Приводимая постановка включает так называемую задачу
оптимального “ трекинга”.
Ключевые слова:
линейно-квадратический регулятор, оптимальность почти наверное, наблюдаемость, управляемость, уравнение Риккати, закон больших чисел для мартингалов, верхние функции, процесс Орнштейна–Уленбека. Поступила в редакцию: 25.12.2002
DOI:
10.4213/tvp250