RUS  ENG
Полная версия
ЖУРНАЛЫ // Вычислительные методы и программирование // Архив

Выч. мет. программирование, 2019, том 20, выпуск 2, страницы 104–115 (Mi vmp952)

Параллельный алгоритм кластеризации данных для многоядерных ускорителей Intel MIC

Т. В. Речкалов, М. Л. Цымблер

Южно-Уральский государственный университет, г. Челябинск

Аннотация: Алгоритм PAM (Partitioning Around Medoids) представляет собой разделительный алгоритм кластеризации, в котором в качестве центров кластеров выбираются только кластеризуемые объекты (медоиды). Кластеризация на основе техники медоидов применяется в широком спектре приложений: сегментирование медицинских и спутниковых изображений, анализ ДНК-микрочипов и текстов и др. На сегодня имеются параллельные реализации PAM для систем GPU и FPGA, но отсутствуют таковые для многоядерных ускорителей архитектуры Intel Many Integrated Core (MIC). В настоящей статье предлагается новый параллельный алгоритм кластеризации PhiPAM для ускорителей Intel MIC. Вычисления распараллеливаются с помощью технологии OpenMP. Алгоритм предполагает использование специализированной компоновки данных в памяти и техники тайлинга, позволяющих эффективно векторизовать вычисления на системах Intel MIC. Эксперименты, проведенные на реальных наборах данных, показали хорошую масштабируемость алгоритма.

Ключевые слова: кластеризация, медоид, параллельный алгоритм, представление данных в памяти, векторизация вычислений.

УДК: 004.272.25; 004.421; 004.032.24

Поступила в редакцию: 26.02.2019

DOI: 10.26089/NumMet.v20r211



Реферативные базы данных:


© МИАН, 2024