Аннотация:
Рассматривается задача оптимального управления для дискретных
систем. Предлагается метод последовательных улучшений и его
модернизация, основанная на разложении основных конструкций базового
алгоритма по параметру. Идея метода основана на локальной
аппроксимации множества достижимости, которое описывается нулями
функции Беллмана в специальной задаче оптимального управления. Суть
этой задачи заключается в следующем: из конечной фазовой точки
требуется найти траекторию, которая минимизирует функционал нормы
отклонения от начального состояния. Если исходная точка принадлежит
множеству достижимости исходной управляемой системы, то значение
функции Беллмана равно нулю, в противном случае значение функции
Беллмана больше нуля. Для этой специальной задачи выписывается
уравнение Беллмана. Выбирается опорное приближение, и функция
Беллмана аппроксимируется квадратичными слагаемыми. Вдоль допустимой
траектории, такая аппроксимация ничего не дает, поскольку сама
функция Беллмана и ее коэффициенты разложения равны нулю. В работе
использован специальный прием: вводится дополнительная переменная,
характеризующая степень отклонения состояния системы от исходного
приближения, тем самым получается расширенная исходная цепочка. Для
новой переменной выбираются начальные условия, отличные от нуля.
Тем
самым получается траектория, лежащая вне множества достижимости.
Соответствующая функция Беллмана оказывается положительной, что
позволяет провести ее нетривиальную аппроксимацию. В результате этих
процедур получены алгоритмы последовательных улучшений. Найдены
условия, обеспечивающие релаксационность алгоритмов, и установлена их
связь с необходимыми условиями оптимальности.
Ключевые слова:дискретные системы, задачи оптимального управления, множество достижимости, метод улучшения.