И. В. Коннов, О. А. Кашина, Э. И. Гильманова, “Решение задачи кластеризации методами оптимизации на графах”, Учен. зап. Казан. ун-та. Сер. Физ.-матем. науки, 2019, том 161, книга 3,страницы 423

Эта публикация цитируется в 3 статьях

Решение задачи кластеризации методами оптимизации на графах

И. В. Коннов, О. А. Кашина, Э. И. Гильманова

Казанский (Приволжский) федеральный университет, г. Казань, 420008, Россия

Аннотация: Быстрый рост объёмов обрабатываемой информации, наблюдаемый в последнее время, увеличение размерности решаемых задач обусловливают актуальность разработки и применения методов снижения размерности. Одним из подходов к снижению размерности данных является их кластеризация, то есть объединение в максимально однородные группы. При этом желательно, чтобы представители разных кластеров были бы максимально «непохожими» друг на друга. Помимо снижения размерности, задачи кластеризации имеют и самостоятельное значение, например, в экономике это связано с сегментированием рынка, в социологии — с типологизацией признаков, в геологии — с фациальной диагностикой пород и т. д.
Несмотря на большое число известных методов решения задачи кластеризации, проблема разработки и исследования новых алгоритмов не теряет актуальности. Дело в том, что не существует алгоритма, который превосходил бы все остальные по всем критериям (быстродействие, нечувствительнсть к размерам и форме кластеров, количество параметров и т. д.).
В статье представлен алгоритм кластеризации, основанный на применении теории графов (теоремы о максимальном потоке и минимальном разрезе) и проведён сравнительный анализ его с четырьмя другими алгоритмами — представителями различных классов методов кластеризации.

Ключевые слова: кластеризация, максимальный поток, минимальный разрез, теорема Форда–Фалкерсона, метод расстановки пометок, метод $k$-средних, иерархическая кластеризация, метод Варда, метод DBSCAN, алгоритм MaxFlow.

УДК: 519.179.2

Поступила в редакцию: 17.10.2018

DOI: 10.26907/2541-7746.2019.3.423-437