Аннотация:
Настоящее исследование посвящено теоретическому обоснованию нового метода нахождения оптимальной стратегии управления полумарковским процессом с конечным множеством состояний. Рассматриваются марковские рандомизированные стратегии управления, определяемые конечным набором вероятностных мер, соответствующих каждому состоянию. Характеристикой качества управления служит стационарный стоимостной показатель. Данный показатель представляет собой дробно-линейный интегральный функционал от набора вероятностных мер, задающих стратегию управления. Для этого функционала известны явные аналитические представления подынтегральных функций числителя и знаменателя. Дальнейшие результаты основываются на новой усиленной и обобщенной форме теоремы об экстремуме дробно-линейного интегрального функционала. Доказывается, что проблемы существования оптимальной стратегии управления полумарковским процессом и ее нахождения сводятся к задаче численного исследования на глобальный экстремум заданной функции от конечного числа вещественных переменных.
Ключевые слова:оптимальное управление полумарковским процессом; стационарный стоимостной показатель качества управления; дробно-линейный интегральный функционал.