RUS  ENG
Полная версия
ЖУРНАЛЫ // Журнал вычислительной математики и математической физики // Архив

Ж. вычисл. матем. и матем. физ., 2010, том 50, номер 4, страницы 770–783 (Mi zvmmf4868)

Эта публикация цитируется в 5 статьях

Автоматическое определение количества компонент в EM-алгоритме восстановления смеси нормальных распределений

Д. П. Ветровa, Д. А. Кропотовb, А. А. Осокинa

a 119992 Москва, Ленинские горы, 1, МГУ, ф-т ВМиК
b 119333 Москва, ул. Вавилова, 40, ВЦ РАН

Аннотация: Классический EM-алгоритм восстановления смеси нормальных распределений не позволяет определять количество компонент смеси. В данной работе предлагается алгоритм автоматического определения числа компонент ARD EM, основанный на методе релевантных векторов. Идея алгоритма состоит в использовании на начальном этапе заведомо избыточного количества компонент смеси с дальнейшим определением релевантных компонент с помощью максимизации обоснованности. Эксперименты на модельных задачах показывают, что количество найденных кластеров либо совпадает с истинным, либо немного превосходит его. Кроме того, кластеризация с помощью ARD EM оказывается ближе к истинной, чем у аналогов, основанных на скользящем контроле и принципе минимальной длины описания. Библ. 14. Фиг. 1. Табл. 4.

Ключевые слова: распознавание образов, восстановление плотностей, кластерный анализ, определение числа кластеров, EM-алгоритм, байесовское обучение, автоматическое определение релевантности.

УДК: 519.6:519.7

Поступила в редакцию: 24.07.2009
Исправленный вариант: 11.11.2009


 Англоязычная версия: Computational Mathematics and Mathematical Physics, 2010, 50:4, 733–746

Реферативные базы данных:


© МИАН, 2024