МАТЕМАТИКА
О выборе базисных функций регрессии и машинном обучении
С. М. Ермаковa,
С. Н. Леораb a Санкт-Петербургский государственный университет, Российская Федерация, 199034, Санкт-Петербург, Университетская наб., 7-9
b Санкт-Петербургский государственный экономический университет, Российская Федерация, 191023, Санкт-Петербург, наб. канала Грибоедова, 30-32
Аннотация:
Как известно, в задачах машинного обучения широко используются средства регрессионного анализа, которые позволяют устанавливать связь между наблюдаемыми переменными и компактно хранить информацию. Наиболее распространенным является случай, когда функция регрессии описывается линейной комбинацией некоторых заданных функций
$f_j(X), j = 1, \ldots , m, X \in D \subset R^s$. Если наблюдаемые данные содержат случайную ошибку, то восстановленная по наблюдениям функция регрессии содержит случайную ошибку и систематическую ошибку, зависящую от выбора функций
$f_j$ . В данной работе указана возможность оптимального, в смысле заданной функциональной метрики, выбора
$f_j$ , если известно, что истинная зависимость подчиняется некоторому функциональному уравнению. В ряде случаев (правильная сетка,
$s \leqslant 2$) близкие результаты могут быть получены с помощью техники анализа случайных процессов. Численные примеры, приведенные в данной работе, иллюстрируют существенно более широкие возможности предполагаемого подхода к задачам регрессии.
Ключевые слова:
регрессионный анализ, аппроксимация, базисные функции, операторный метод, машинное обучение.
УДК:
519.245
MSC: 65C05 Поступила в редакцию: 16.07.2021
Исправленный вариант: 25.08.2021
Принята в печать: 02.09.2021
DOI:
10.21638/spbu01.2022.102