RUS  ENG
Полная версия
ЖУРНАЛЫ // Доклады Российской академии наук. Математика, информатика, процессы управления // Архив

Докл. РАН. Матем., информ., проц. упр., 2024, том 520, номер 2, страницы 295–312 (Mi danma608)

СПЕЦИАЛЬНЫЙ ВЫПУСК: ТЕХНОЛОГИИ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА И МАШИННОГО ОБУЧЕНИЯ

Алгоритм нулевого порядка для решения задач децентрализованной оптимизации

А. С. Веприковabc, Е. Д. Петровa, Г. В. Евсеевa, А. Н. Безносиковacd

a Московский физико-технический институт, Москва, Россия
b Институт системного программирования им. В.П. Иванникова Российской академии наук РАН, Москва, Россия
c ПАО Сбербанк, Лаборатория ИИ, Москва, Россия
d Университет Иннополиса, Иннополис, респ. Татарстан, Россия

Аннотация: В работе рассматривается задача распределенной оптимизации в постановке черного ящика. Это означает, что целевая функция $f$ раскладывается на сумму $n$ функций, где $n$ – количество работников, при этом предполагается, что каждый работник имеет доступ только к зашумленному оракулу нулевого порядка, т.е. только к значениям $f (x)$ с добавленным шумом. В статье предлагается новый метод ZO-MARINA, основанный на state-of-the-art алгоритме распределенной оптимизации MARINA. В частности, для решения задачи в постановке черного ящика вносятся следующие изменения: i) вместо честного градиента используется его аппроксимация, ii) вместо оператора сжатия используется разность двух аппроксимированных градиентов по некоторым координатам. В работе проводится теоретический анализ сходимости для невыпуклых функций и функций, удовлетворяющих условию Поляка–Лоясиевича. Скорость работы предложенного алгоритма соотносится с результатами для алгоритма, который использует оракул первого порядка. Теоретические результаты подтверждаются в вычислительных экспериментах по поиску оптимальных гиперпараметров для нейронной сети Resnet-18 при обучении на наборе данных CIFAR-10 и модели SVM на наборе данных из библиотеки LibSVM и на наборе данных Mnist-784.

Ключевые слова: распределенная оптимизация, методы нулевого порядка, безградиентные методы, машинное обучение.

УДК: 004.8

Поступило: 27.09.2024
Принято к публикации: 02.10.2024

DOI: 10.31857/S2686954324700656


 Англоязычная версия: Doklady Mathematics, 2024, 110:suppl. 1, 261–S277

Реферативные базы данных:


© МИАН, 2025