RUS  ENG
Полная версия
ЖУРНАЛЫ // Вестник Удмуртского университета. Математика. Механика. Компьютерные науки // Архив

Вестн. Удмуртск. ун-та. Матем. Мех. Компьют. науки, 2014, выпуск 2, страницы 29–42 (Mi vuu425)

МАТЕМАТИКА

Об одном детерминированном подходе к решению задач стохастического оптимального управления с управляемой диффузией

Н. С. Исмагилов

Уфимский государственный авиационный технический университет, 450000, Россия, г. Уфа, ул. К. Маркса, 12

Аннотация: В работе рассматривается задача оптимального управления одномерным процессом, заданным стохастическим дифференциальным уравнением, в котором управление воздействует как на коэффициент сноса, так и на коэффициент диффузии, при этом диффузионная составляющая линейна по управлению
$$dx(t) = b(t,x(t),u(t))\,dt + \sigma(t,x(t))u(t)\,dW(t), \quad x(0) = x_0.$$
Здесь $x(t)$ — фазовая координата, $u(t)$ — управляющая функция, $W(t)$ — винеровский процесс. Доказана теорема, которая предоставляет структуру решения рассматриваемого уравнения в виде суперпозиции функций $x(t) = \Phi(t,u(t)W(t) + y(t))$, в котором $\Phi(t,v)$ — известная функция, полностью определяющаяся коэффициентом $\sigma(t,x)$, и не зависит от управления, а $y(t)$ — решение потраекторно-детерминированного дифференциального уравнения с мерой вида
$$dy(t) = B(t,y(t),u(t))\,dt - W(t)\,du(t).$$

Выявленная структура решения позволяет вместо исходной стохастической задачи оптимального управления исследовать новую эквивалентную задачу с фазовой переменной $y(t)$, которая является потраекторно-детерминированной задачей оптимального импульсного управления. При детерминированном рассмотрении новой задачи решения последней могут оказаться упреждающими функциями, поэтому в работе предлагается метод, который позволяет добиться неупреждаемости оптимальных решений. Суть метода заключается в модификации функционала потерь в новой потраекторно-детерминированной задаче специальным образом подобранным интегральным слагаемым, которое позволяет гарантировать неупреждаемость решений.

Ключевые слова: стохастическое оптимальное управление, стохастические дифференциальные уравнения, детерминированный подход, потраекторная оптимизация, оптимальное импульсное управление.

УДК: 519.21, 517.977

MSC: 93E20, 49K45, 60H30, 49N25

Поступила в редакцию: 29.10.2013



© МИАН, 2024