RUS  ENG
Полная версия
ЖУРНАЛЫ // Вестник Южно-Уральского государственного университета. Серия «Вычислительная математика и информатика» // Архив

Вестн. ЮУрГУ. Сер. Выч. матем. информ., 2019, том 8, выпуск 1, страницы 54–70 (Mi vyurv206)

Параллельный поиск частых наборов на многоядерных ускорителях Intel MIC

М. Л. Цымблер

Южно-Уральский государственный университет (454080 Челябинск, пр. им. В.И. Ленина, д. 76)

Аннотация: Поиск ассоциативных правил предполагает нахождение устойчивых корреляций между наборами элементов в больших базах транзакционных данных и является одной из основных задач интеллектуального анализа данных. Ассоциативные правила генерируются на основе множества всех наборов, в которых элементы часто встречаются совместно. Алгоритм DIC (Dynamic Itemset Counting) является модификацией классического алгоритма Apriori поиска частых наборов. В отличие от предшественника DIC пытается сократить количество проходов по базе транзакций и сохранить при этом относительно небольшое количество наборов, поддержка которых подсчитывается в рамках одного прохода. В статье рассмотрена проблема ускорения алгоритма DIC на многоядерной архитектуре Intel Many Integrated Core (MIC) для случая, когда база транзакций помещается в оперативную память. Разработанная с помощью технологии OpenMP параллельная реализация алгоритма DIC использует битовое представление транзакций и наборов, что позволяет ускорить и векторизовать подсчет поддержки наборов, реализуемый посредством логических побитовых операций. Проведенные эксперименты с синтетическими и реальными данными подтвердили хорошую производительность и масштабируемость предложенного алгоритма.

Ключевые слова: интеллектуальный анализ данных, поиск ассоциативных правил, OpenMP, Intel Many Integrated Core.

УДК: 004.272.25, 004.421, 004.032.24

Поступила в редакцию: 26.12.2018

DOI: 10.14529/cmse190104



Реферативные базы данных:


© МИАН, 2024