МАТЕМАТИКА
Об одном детерминированном подходе к решению задач стохастического оптимального управления с управляемой диффузией
Н. С. Исмагилов Уфимский государственный авиационный технический университет, 450000, Россия, г. Уфа, ул. К. Маркса, 12
Аннотация:
В работе рассматривается задача оптимального управления одномерным процессом, заданным стохастическим дифференциальным уравнением, в котором управление воздействует как на коэффициент сноса, так и на коэффициент диффузии, при этом диффузионная составляющая линейна по управлению
$$dx(t) = b(t,x(t),u(t))\,dt + \sigma(t,x(t))u(t)\,dW(t), \quad x(0) = x_0.$$
Здесь
$x(t)$ — фазовая координата,
$u(t)$ — управляющая функция,
$W(t)$ — винеровский процесс. Доказана теорема, которая предоставляет структуру решения рассматриваемого уравнения в виде суперпозиции функций
$x(t) = \Phi(t,u(t)W(t) + y(t))$, в котором
$\Phi(t,v)$ — известная функция, полностью определяющаяся коэффициентом
$\sigma(t,x)$, и не зависит от управления, а
$y(t)$ — решение потраекторно-детерминированного дифференциального уравнения с мерой вида
$$dy(t) = B(t,y(t),u(t))\,dt - W(t)\,du(t).$$
Выявленная структура решения позволяет вместо исходной стохастической задачи оптимального управления исследовать новую эквивалентную задачу с фазовой переменной
$y(t)$, которая является потраекторно-детерминированной задачей оптимального импульсного управления. При детерминированном рассмотрении новой задачи решения последней могут оказаться упреждающими функциями, поэтому в работе предлагается метод, который позволяет добиться неупреждаемости оптимальных решений. Суть метода заключается в модификации функционала потерь в новой потраекторно-детерминированной задаче специальным образом подобранным интегральным слагаемым, которое позволяет гарантировать неупреждаемость решений.
Ключевые слова:
стохастическое оптимальное управление, стохастические дифференциальные уравнения, детерминированный подход, потраекторная оптимизация, оптимальное импульсное управление.
УДК:
519.21,
517.977
MSC: 93E20,
49K45,
60H30,
49N25 Поступила в редакцию: 29.10.2013