Д. М. Двинских, В. В. Пырэу, А. В. Гасников, “О связях задач стохастической выпуклой минимизации с задачами минимизации эмпирического риска на шарах в p-нормах”, Компьютерные исследования и моделирование, 2022, том 14, выпуск 2,страницы 309

МАТЕМАТИЧЕСКИЕ ОСНОВЫ И ЧИСЛЕННЫЕ МЕТОДЫ МОДЕЛИРОВАНИЯ

О связях задач стохастической выпуклой минимизации с задачами минимизации эмпирического риска на шарах в p-нормах

Д. М. Двинских^ab, В. В. Пырэу^a, А. В. Гасников^abc

^a Московский физико-технический институт (национальный исследовательский университет), Московская облаcть, г. Долгопрудный
^b Институт проблем передачи информации им. А.А. Харкевича Российской академии наук, г. Москва
^c Кавказский математический центр, Адыгейский государственный университет, г. Майкоп

Аннотация: В данной работе рассматриваются задачи выпуклой стохастической оптимизации, возникающие в анализе данных (минимизация функции риска), а также в математической статистике (минимизация функции правдоподобия). Такие задачи могут быть решены как онлайн-, так и офлайн-методами (метод Монте-Карло). При офлайн-подходе исходная задача заменяется эмпирической задачей — задачей минимизации эмпирического риска. В современном машинном обучении ключевым является следующий вопрос: какой размер выборки (количество слагаемых в функционале эмпирического риска) нужно взять, чтобы достаточно точное решение эмпирической задачи было решением исходной задачи с заданной точностью. Базируясь на недавних существенных продвижениях в машинном обучении и оптимизации для решения выпуклых стохастических задач на евклидовых шарах (или всем пространстве), мы рассматриваем случай произвольных шаров в $p$-нормах и исследуем, как влияет выбор параметра $p$ на оценки необходимого числа слагаемых в функции эмпирического риска.
В данной работе рассмотрены как выпуклые задачи оптимизации, так и седловые. Для сильно выпуклых задач были обобщены уже имеющиеся результаты об одинаковых размерах выборки в обоих подходах (онлайн и офлайн) на произвольные нормы. Более того, было показано, что условие сильной выпуклости может быть ослаблено: полученные результаты справедливы для функций, удовлетворяющих условию квадратичного роста. В случае когда данное условие не выполняется, предлагается использовать регуляризацию исходной задачи в произвольной норме. В отличие от выпуклых задач седловые задачи являются намного менее изученными. Для седловых задач размер выборки был получен при условии $\gamma$-роста седловой функции по разным группам переменных. Это условие при $\gamma=1$ есть не что иное, как аналог условия острого минимума в выпуклых задач. В данной статье было показано, что размер выборки в случае острого минимума (седла) почти не зависит от желаемой точности решения исходной задачи.

Ключевые слова: выпуклая оптимизация, стохастическая оптимизация, регуляризация, острый минимум, условие квадратичного роста, метод Монте-Карло.

УДК: 519.8

Поступила в редакцию: 01.02.2022
Принята в печать: 13.02.2022

DOI: 10.20537/2076-7633-2022-14-2-309-319