Аннотация:
Описан конструктивный метод решения новой «обратной» задачи управления случайным блужданием (цепью Маркова) с непрерывным ограниченным и замкнутым двумерным множеством состояний, вероятности перехода которой зависят от текущего значения цепи. Цель управления — отыскание такой стратегии, при которой стационарное распределение цепи наиболее приближено в определенном смысле к эталонному. Реализация метода осуществляется с помощью квазиградиентного алгоритма определения оптимальных значений параметров стратегии, основанного на оценках частных производных целевой функции по наблюдениям за фазовой траекторией. Приведены численные результаты работы алгоритма в примерах с простейшими эталонными плотностями. Внедрение полученных результатов в подвижных объектах (например, беспилотных летательных аппаратах) позволяет наделить их способностью стохастического автономного движения.