Ж. вычисл. матем. и матем. физ.,
2024, том 64, номер 4,страницы 627–636(Mi zvmmf11730)
Оптимальное управление
Метод Б.Т. Поляка на основе стохастической функции Ляпунова для обоснования состоятельности оценок поискового алгоритма стохастической аппроксимации при неизвестных, но ограниченных помехах
Аннотация:
В 1976–1977 гг. Б.Т. Поляк опубликовал в журнале “Автоматика и телемеханика” две замечательные статьи о том, как исследовать свойства оценок итеративных псевдоградиентных алгоритмов. В первой статье 1976 г. рассматривался общий случай на основе стохастической функции Ляпунова, во второй – линейный случай. Сформулированные предположения и полученные в статьях оценки до сих пор можно считать результатами уровня “state of the art”. В настоящей статье этот ставший классическим подход Б.Т. Поляка применяется к исследованию свойств оценок поискового (рандомизированного) алгоритма стохастической аппроксимации для случая неизвестных, но ограниченных помех в наблюдениях. Полученные асимптотические оценки были известны уже и ранее, точные оценки для конечного числа наблюдений публикуются впервые.
Библ. 18.
Ключевые слова:поисковый алгоритм стохастической аппроксимации, “неизвестные, но ограниченные помехи”, аппроксимация градиента, сглаживающие ядра, безградиентные методы, методы с неточным оракулом.
УДК:519.85
Поступила в редакцию: 15.09.2023 Исправленный вариант: 06.11.2023 Принята в печать: 20.11.2023