RUS  ENG
Полная версия
ЖУРНАЛЫ // Информатика и её применения // Архив

Информ. и её примен., 2022, том 16, выпуск 3, страницы 52–58 (Mi ia800)

Эта публикация цитируется в 2 статьях

Выбор модели при факторизации матрицы данных с пропусками

М. П. Кривенко

Федеральный исследовательский центр «Информатика и управление» Российской академии наук

Аннотация: Работа посвящена задаче факторизации матрицы с отсутствующими компонентами в произведение двух матриц более низкого ранга. Исследовано влияние интенсивности пропусков на выбор модели факторизации. Рассматриваются два алгоритма оценивания параметров: альтернирующий наименьших квадратов (alternating least square, ALS) и Вайберга (Wiberg) — для двух моделей факторизации: со средними и без. Обосновывается, что в использовании модели со средними нет необходимости: она является частным случаем другой модели, приводит в отдельных случаях к неоднозначным решениям. При проведении экспериментов предпочтение отдано более устойчивому ALS-алгоритму. Продемонстрированы преимущества метода вставки перед случайным заполнением при начальных установках итерационных алгоритмов оценивания параметров модели. Выявлены причины негативных свойств существующей редакции алгоритма Вайберга. На основании экспериментов установлено: с ростом вероятности пропуска точность представления имеющихся данных увеличивается, что приводит к занижению истинного значения размерности модели.

Ключевые слова: понижающая ранг аппроксимация матрицы, сингулярное разложение, пропущенные данные, ALS-алгоритм, алгоритм Вайберга.

Поступила в редакцию: 15.04.2022

DOI: 10.14357/19922264220307



© МИАН, 2024