RUS  ENG
Полная версия
ЖУРНАЛЫ // Интеллектуальные системы. Теория и приложения // Архив

Интеллектуальные системы. Теория и приложения, 2021, том 25, выпуск 4, страницы 12–18 (Mi ista410)

Часть 1. Пленарные доклады

Методы осреднения в задачах кластеризации больших данных

Р. Р. Айдагулов, С. Т. Главацкий, А. В. Михалёв

Московский государственный университет имени М.В. Ломоносова

Аннотация: У кластерного анализа очень широкий спектр применения, его методы используются в медицине, химии, археологии, маркетинге, геологии и других дисциплинах. Кластеризация состоит в объединении в группы схожих объектов, и эта задача является одной из фундаментальных в области интеллектуального анализа данных. Обычно под кластеризацией понимается разбиение заданного множества точек некоторого метрического пространства на подмножества таким образом, чтобы близкие точки попали в одну группу, а дальние - в разные. В данной работе предлагается метод локального осреднения для вычисления плотности распределения данных как точек в метрическом пространстве. Выбирая далее срезы множества точек по определенному уровню плотности, мы получаем разбиение на кластеры. Предложенный метод предлагает устойчивое разбиение на кластеры и свободен от ряда недостатков, присущих известным методам кластеризации.

Ключевые слова: кластер, алгоритм, плотность, метод осреднения.



© МИАН, 2024