Аннотация:
Предложен новый подход к построению алгоритмов кластеризации $k$-means, в котором вместо евклидова расстояния используется расстояние Махаланобиса. Подход основан на минимизации дифференцируемых оценок среднего значения, нечувствительных к выбросам. На иллюстративных примерах убедительно показана возможность устойчивости предложенного алгоритма по отношению к большим объемам выбросов в данных.
Ключевые слова:
центр кластера, робастное среднее, расстояние Махаланобиса, итеративное перевзвешивание, робастный алгоритм.
Статья представлена к публикации членом редколлегии:А. А. Лазарев
Поступила в редакцию: 24.01.2021 После доработки: 26.04.2021 Принята к публикации: 30.06.2021