Аннотация:
Предложен метод управления матрицей переходов марковской цепочки на основе стохастической аппроксимации с учетом вида отклика, заданного логистической функцией. Для вывода управления используется модификация метод Роббинса-Монро, обеспечивающая гарантию сходимости метода. Достоинство метода заключается в кратном улучшении скорости сходимости метода на основе информации о начальном приближения и вида функции логистической регрессии. Доказательство метода приводится рекурсивно, путем доказательства оптимальности на каждом шаге. Для валидации метода приведены результаты численного моделирования, подтверждающие эффективность разработанной модификации в постановках малой и значительной чувствительности функции отклика к контролю.
|