RUS  ENG
Полная версия
ВИДЕОТЕКА

Вторая конференция Математических центров России. Секция «Уравнения с частными производными»
7 ноября 2022 г. 17:50, г. Москва, Ломоносовский корпус МГУ, аудитория Д5, Ломоносовский пр., 27, к. 1


Аппроксимация решений уравнения Беллмана для задач управления средним полем

Ю. В. Авербух

Аннотация: В докладе рассматривается задача управления средним полем, моделирующая движение большой группы агентов с динамикой \[\frac{d}{dt}x(t)=f(t,x(t),m(t),u(t)), t\in [0,T],x(t)\in\mathbb{T}^d,m(t)\in\mathcal{P}(\mathbb{T}^d), u\in U.\] Здесь $\mathbb{T}^d$ обозначает $d$-мерный тор, $\mathcal{P}(\mathbb{T}^d)$ – пространство вероятностей на торе, снабженное метрикой Канторовича. Также $m(t)$ обозначает распределение всех агентов в момент времени $t$. Подход управления средним полем предполагает, что агенты выбирают свое управление независимо, но действуют кооперативно, стремясь минимизировать величину $\sigma(m(T))$.
Отметим, что в данном случае в качестве позиции выступает вероятность, описывающая распределение агентов.
Основным объектом исследования является функция цены $\operatorname{Val}(t_0,m_0)$, которая сопоставляет начальному моменту времени $t_0$ и начальному распределению агентов $m_0$ значение $\sigma(m(T))$ при оптимальном управлении. Эта функция должна удовлетворять уравнению Беллмана \[\frac{\partial\varphi}{\partial t}+H(t,m,\nabla_m\varphi)=0,\] где $\nabla_m\varphi$ – производная функции $\varphi$ по $m$.
В докладе рассматривается построение приближений функции цены решениями конечномерных уравнений типа Гамильтона-Якоби \[\frac{\partial}{\partial t}\phi+\mathcal{H}(t,\mu,\nabla_\mu\phi)=0,\] где $\mu$ — элемент некоторого конечномерного симплекса $\Sigma$, $\phi:[0,T]\times\Sigma\rightarrow\mathbb{R}$. Отметим, что конечномерное уравнение Гамильтона–Якоби возникает как уравнение Беллмана в некоторой конечномерной задаче управления, интерпретируемой как задача управления средним полем с конечным числом состояний.


© МИАН, 2024