RUS  ENG
Полная версия
ЖУРНАЛЫ // Компьютерные исследования и моделирование // Архив

Компьютерные исследования и моделирование, 2022, том 14, выпуск 2, страницы 213–223 (Mi crm964)

МАТЕМАТИЧЕСКИЕ ОСНОВЫ И ЧИСЛЕННЫЕ МЕТОДЫ МОДЕЛИРОВАНИЯ

Нижние оценки для методов типа условного градиента для задач минимизации гладких сильно выпуклых функций

А. Д. Агафонов

Национальный исследовательский университет «Московский физико-технический институт», Россия, 141701, Московская облаcть, г. Долгопрудный, Институтский пер., 9

Аннотация: В данной работе рассматриваются методы условного градиента для оптимизации сильно выпуклых функций. Это методы, использующие линейный минимизационный оракул, то есть умеющие вычислять решение задачи
$$\underset{x \in X}{\mathrm{Argmin}}\langle p,x\rangle$$
для заданного вектора $p \in \mathbb{R}^n$. Существует целый ряд методов условного градиента, имеющих линейную скорость сходимости в сильно выпуклом случае. Однако во всех этих методах в оценку скорости сходимости входит размерность задачи, которая в современных приложениях может быть очень большой. В данной работе доказывается, что в сильно выпуклом случае скорость сходимости методов условного градиента в лучшем случае зависит от размерности задачи $n$ как $\tilde{\Omega}(\sqrt{n})$ Таким образом, методы условного градиента могут оказаться неэффективными для решения сильно выпуклых оптимизационных задач больших размерностей.
Отдельно рассматривается приложение методов условного градиента к задачам минимизации квадратичной формы. Уже была доказана эффективность метода Франк–Вульфа для решения задачи квадратичной оптимизации в выпуклом случае на симплексе (PageRank). Данная работа показывает, что использование методов условного градиента для минимизации квадратичной формы в сильно выпуклом случае малоэффективно из-за наличия размерности в оценке скорости сходимости этих методов. Поэтому рассматривается метод рестартов условного градиента (Shrinking Conditional Gradient). Его отличие от методов условного градиента заключается в том, что в нем используется модифицированный линейный минимизационный оракул, который для заданного вектора $p \in \mathbb{R}^n$ вычисляет решение задачи
$$\mathrm{Argmin}\{\langle p,x \rangle: x\in X, \parallel x-x_0 \parallel \le R\}. $$
В оценку скорости сходимости такого алгоритма размерность уже не входит. С помощью рестартов метода условного градиента получена сложность (число арифметических операций) минимизации квадратичной формы на $\infty$-шаре. Полученная оценка работы метода сравнима со сложностью градиентного метода.

Ключевые слова: метод Франк-Вульфа, рестарты.

УДК: 519.85

Поступила в редакцию: 10.03.2020
Принята в печать: 14.03.2022

DOI: 10.20537/2076-7633-2022-14-2-213-223



© МИАН, 2024