Аннотация:
Решается задача оптимального управления для диффузионного процесса Ито и линейного управляемого выхода. Рассматриваемая постановка близка к классической линейно-квадратичной гауссовской задаче управления (linear-quadratic Gaussian (LQG) control). Отличия состоят в том, что состояние описывается нелинейным дифференциальным уравнение Ито $dy_t= A_t(y_t) \,dt+ \Sigma_t(y_t)\,dv_t$ и не зависит от управления $u_t$, оптимизации подлежит управляемый линейный выход $dz_t= a_t y_t\,dt+ b_t z_t \,dt+ c_t u_t \,dt+ \sigma_t\, dw_t$. Дополнительные обобщения внесены в квадратичный критерий качества с целью возможности постановки таких задач, как отслеживание выходом состояния или управлением — линейной комбинации состояния и выхода. Для решения используется метод динамического программирования. Функцию Беллмана позволяет найти предположение о ее структуре вида $V_t(y,z)= \alpha_t z^2+ \beta_t(y)z +\gamma_t(y)$. Решение дают три дифференциальных уравнения для коэффициентов $\alpha_t$, $\beta_t(y)$ и $\gamma_t(y)$. Эти уравнения составляют оптимальное решение рассматриваемой задачи.
Ключевые слова:стохастическое дифференциальное уравнение; оптимальное управление; динамическое программирование; функция Беллмана; уравнение Риккати; линейные уравнения параболического типа.