Аннотация:
Работа посвящена задаче факторизации матрицы с отсутствующими компонентами в произведение двух матриц более низкого ранга. Исследовано влияние интенсивности пропусков на выбор модели факторизации. Рассматриваются два алгоритма оценивания параметров: альтернирующий наименьших квадратов (alternating least square, ALS) и Вайберга (Wiberg) — для двух моделей факторизации: со средними и без. Обосновывается, что в использовании модели со средними нет необходимости: она является частным случаем другой модели, приводит в отдельных случаях к неоднозначным решениям. При проведении экспериментов предпочтение отдано более устойчивому ALS-алгоритму. Продемонстрированы преимущества метода вставки перед случайным заполнением при начальных установках итерационных алгоритмов оценивания параметров модели. Выявлены причины негативных свойств существующей редакции алгоритма Вайберга. На основании экспериментов установлено: с ростом вероятности пропуска точность представления имеющихся данных увеличивается, что приводит к занижению истинного значения размерности модели.