RUS  ENG
Полная версия
ЖУРНАЛЫ // Фундаментальная и прикладная математика // Архив

Фундамент. и прикл. матем., 2020, том 23, выпуск 2, страницы 17–36 (Mi fpm1881)

Модели кластеризации

Р. Р. Айдагуловa, С. Т. Главацкийab, А. В. Михалёвab

a Московский государственный университет им. М. В. Ломоносова
b Московский центр фундаментальной и прикладной математики

Аннотация: Принято считать, что термин «кластеризация» (сгусток, пучок) был предложен математиком Р. Трионом. Впоследствии возник целый ряд терминов, которые рассматриваются как синонимы термина «кластерный анализ»или «автоматическая классификация». У кластерного анализа очень широкий спектр применения, его методы используются в медицине, химии, археологии, маркетинге, геологии и других дисциплинах. Кластеризация состоит в объединении в группы схожих объектов, и эта задача является одной из фундаментальных в области анализа данных. Обычно под кластеризацией понимается разбиение заданного множества точек некоторого метрического пространства на подмножества таким образом, чтобы близкие точки попали в одну группу, а дальние  — в разные. Как мы покажем ниже, это требование является довольно противоречивым. Интуитивное разбиение «на глаз»использует соображение связности получаемых групп, исходя из плотности распределения точек. В данной работе предлагается метод кластеризации, основанный на этой идее.

Ключевые слова: кластер, алгоритм, плотность, метод осреднения.

УДК: 004.021


 Англоязычная версия: Journal of Mathematical Sciences (New York), 2022, 262:5, 603–616


© МИАН, 2024