Аннотация:
Исследуется задача управления стохастической системой с дискретным временем. Критерием оптимальности является вероятность непревышения функцией терминального состояния заданного порога. Для решения задачи применяется метод динамического программирования. Функция потерь предполагается полунепрерывной снизу относительно вектора терминального состояния, а функция перехода из текущего состояния в последующее считается непрерывной относительно всех своих аргументов. Устанавливается, что алгоритм динамического программирования позволяет в этом случае найти оптимальные позиционные стратегии управления, которые оказываются измеримыми. В качестве примера рассматривается двухшаговая задача формирования портфеля ценных бумаг. Устанавливается, что в этом частном случае функция будущих потерь на втором шаге оказывается непрерывной за исключением одной точки.