Аннотация:
Исследуется задача оптимального управления дискретной стохастической системой с критерием вероятности удержания траекторий системы
на заранее заданных множествах. С помощью метода динамического программирования и поверхностей уровня 1 и 0 функции Беллмана находятся двусторонние оценки функции правой части соотношения динамического программирования, двусторонние оценки функции Беллмана и
функции оптимального значения вероятностного критерия. С помощью
этих результатов выводятся выражения для приближенного определения
оптимального управления. В качестве примера рассматривается задача
удержания перевернутого маятника в окрестности неустойчивого положения равновесия.
Ключевые слова:дискретные системы, стохастическое оптимальное управление, вероятностный критерий, метод динамического программирования, функция Беллмана, перевернутый маятник.
Статья представлена к публикации членом редколлегии:А. В. Назин
Поступила в редакцию: 24.12.2019 После доработки: 20.05.2020 Принята к публикации: 09.07.2020