Аннотация:
Рассматривается задача оптимального управления дискретной стохастической системой с критерием в форме вероятности первого достижения границ заданной области. Формулируются и доказываются достаточные условия оптимальности в форме метода динамического программирования. С помощью поверхностей уровней 1 и 0 функции Беллмана находятся двусторонние оценки функции правой части уравнения метода динамического программирования, функции Беллмана и функции оптимального значения вероятностного критерия, и предлагается способ построения субоптимального управления. Формулируются условия эквивалентности с задачей оптимального управления с вероятностным терминальным критерием. Рассматривается пример.
Ключевые слова:дискретные системы, стохастическое оптимальное управление, вероятностный критерий, метод динамического программирования, функция Беллмана.
Статья представлена к публикации членом редколлегии:А. И. Кибзун
Поступила в редакцию: 02.03.2020 После доработки: 20.05.2020 Принята к публикации: 09.07.2020