A. A. Gudkov, S. V. Mironov, S. P. Sidorov, S. V. Tyshkevich, “A dual active set algorithm for optimal sparse convex regression”, Вестн. Сам. гос. техн. ун-та. Сер. Физ.-мат. науки, 2019, том 23, номер 1,страницы 113

Эта публикация цитируется в 2 статьях

Математическое моделирование, численные методы и комплексы программ

A dual active set algorithm for optimal sparse convex regression

[Двойственный алгоритм на основе активного множества для построения оптимальной разреженной выпуклой регрессии]

A. A. Gudkov, S. V. Mironov, S. P. Sidorov, S. V. Tyshkevich

N. G. Chernyshevsky Saratov State University (National Research University), Saratov, 410012, Russian Federation

Аннотация: В последнее время задачи статистики с ограничениями на форму данных привлекают повышенное внимание. Одной из таких задач является задача поиска оптимальной монотонной регрессии. Проблема построения монотонной регрессии (которая также называется изотонной регрессией) состоит в том, чтобы для данного вектора (не обязательно монотонного) найти неубывающий вектор с наименьшей ошибкой приближения к данному. Выпуклая регрессия есть развитие понятия монотонной регрессии для случая $2$-монотонности (т.е. выпуклости). Как изотонная, так и выпуклая регрессия находят применение во многих областях, включая непараметрическую математическую статистику и сглаживание эмпирических данных. В данной статье предлагается итерационный алгоритм построения разреженной выпуклой регрессии, т.е. для нахождения выпуклого вектора $z\in \mathbb{R}^n$ с наименьшей квадратичной ошибкой приближения к данному вектору $y\in \mathbb{R}^n$ (не обязательно являющемуся выпуклым). Задача может быть представлена в виде задачи выпуклого программирования с линейными ограничениями. Используя условия оптимальности Каруша–Куна–Таккера, доказано, что оптимальные точки должны лежать на кусочно-линейной функции. Доказано, что предложенный двойственный алгоритм на основе активного множества для построения оптимальной разреженной выпуклой регрессии имеет полиномиальную сложность и позволяет найти оптимальное решение (для которого выполнены условия Каруша–Куна–Таккера).

Ключевые слова: двойственный алгоритм, активное множество, изотонная регрессия, монотонная регрессия, выпуклая регрессия.

УДК: 519.65, 519.25, 519.853

MSC: 90C20, 65K05, 62G08

Получение: 22 января 2019 г.
Исправление: 2 марта 2019 г.
Принятие: 4 марта 2019 г.
Публикация онлайн: 5 марта 2019 г.

Язык публикации: английский

DOI: 10.14498/vsgtu1673