Аннотация:
Классический EM-алгоритм восстановления смеси нормальных распределений не позволяет определять количество компонент смеси. В данной работе предлагается алгоритм автоматического определения числа компонент ARD EM, основанный на методе релевантных векторов. Идея алгоритма состоит в использовании на начальном этапе заведомо избыточного количества компонент смеси с дальнейшим определением релевантных компонент с помощью максимизации обоснованности. Эксперименты на модельных задачах показывают, что количество найденных кластеров либо совпадает с истинным, либо немного превосходит его. Кроме того, кластеризация с помощью ARD EM оказывается ближе к истинной, чем у аналогов, основанных на скользящем контроле и принципе минимальной длины описания. Библ. 14. Фиг. 1. Табл. 4.
Ключевые слова:распознавание образов, восстановление плотностей, кластерный анализ, определение числа кластеров, EM-алгоритм, байесовское обучение, автоматическое определение релевантности.
УДК:
519.6:519.7
Поступила в редакцию: 24.07.2009 Исправленный вариант: 11.11.2009