Аннотация:
Принято считать, что термин «кластеризация» (сгусток, пучок) был предложен математиком Р. Трионом. Впоследствии возник целый ряд терминов, которые рассматриваются как синонимы термина «кластерный анализ»или «автоматическая классификация». У кластерного анализа очень широкий спектр применения, его методы используются в медицине, химии, археологии, маркетинге, геологии и других дисциплинах. Кластеризация состоит в объединении в группы схожих объектов, и эта задача является одной из фундаментальных в области анализа данных. Обычно под кластеризацией понимается разбиение заданного множества точек некоторого метрического пространства на подмножества таким образом, чтобы близкие точки попали в одну группу, а дальние — в разные. Как мы покажем ниже, это требование является довольно противоречивым. Интуитивное разбиение «на глаз»использует соображение связности получаемых групп, исходя из плотности распределения точек. В данной работе предлагается метод кластеризации, основанный на этой идее.
Ключевые слова:кластер, алгоритм, плотность, метод осреднения.