Аннотация:
Анализ главных компонент (PCA — Principal Component Analysis) широко используется при исследовании данных, их сжатии и визуализации. Новые возможности открывает вероятностный PCA (PPCA — probabilistic PCA), реализуемый в рамках принципа максимального правдоподобия для гауссовской модели с латентными переменными. В рамках PPCA появились алгоритмы обработки данных, нацеленные на снижение размерности данных и обеспечивающие переход в пространство главных компонент, но не дающие в явном виде характеристики главных компонент. Статья посвящена деталям, углубляющим понимание особенностей PPCA, исправлениям выявленных ошибок в публикациях. Предложены и обоснованы два метода реконструкции характеристик главных компонент. Один из них основывается на пересчете ковариационной матрицы в сформированном пространстве главных компонент. Другой метод заключается в последовательном повторении одинаковых шагов: выявления первой главной компоненты и исключения ее из анализа данных.
Ключевые слова:анализ главных компонент; EM-алгоритм; реконструкция осей и дисперсий главных компонент.