А. В. Босов, А. И. Стефанович, “Управление выходом стохастической дифференциальной системы по квадратичному критерию. I. Оптимальное решение методом динамического программирования”, Информ. и её примен., 2018, том 12, выпуск 3,страницы 99

Эта публикация цитируется в 7 статьях

Управление выходом стохастической дифференциальной системы по квадратичному критерию. I. Оптимальное решение методом динамического программирования

А. В. Босов, А. И. Стефанович

Институт проблем информатики Федерального исследовательского центра «Информатика и управление» Российской академии наук

Аннотация: Решается задача оптимального управления для диффузионного процесса Ито и линейного управляемого выхода. Рассматриваемая постановка близка к классической линейно-квадратичной гауссовской задаче управления (linear-quadratic Gaussian (LQG) control). Отличия состоят в том, что состояние описывается нелинейным дифференциальным уравнение Ито $dy_t= A_t(y_t) \,dt+ \Sigma_t(y_t)\,dv_t$ и не зависит от управления $u_t$, оптимизации подлежит управляемый линейный выход $dz_t= a_t y_t\,dt+ b_t z_t \,dt+ c_t u_t \,dt+ \sigma_t\, dw_t$. Дополнительные обобщения внесены в квадратичный критерий качества с целью возможности постановки таких задач, как отслеживание выходом состояния или управлением — линейной комбинации состояния и выхода. Для решения используется метод динамического программирования. Функцию Беллмана позволяет найти предположение о ее структуре вида $V_t(y,z)= \alpha_t z^2+ \beta_t(y)z +\gamma_t(y)$. Решение дают три дифференциальных уравнения для коэффициентов $\alpha_t$, $\beta_t(y)$ и $\gamma_t(y)$. Эти уравнения составляют оптимальное решение рассматриваемой задачи.

Ключевые слова: стохастическое дифференциальное уравнение; оптимальное управление; динамическое программирование; функция Беллмана; уравнение Риккати; линейные уравнения параболического типа.

Поступила в редакцию: 30.03.2018

DOI: 10.14357/19922264180314