Аннотация:
Предлагается новый эффективный алгоритм GoalApriori, позволяющий строить ассоциативные правила для частного, но важного случая, когда исходная реляционная база данных имеет целевой параметр. Классическим примером таких баз данных являются медицинские базы данных, где в роли целевого параметра выступает диагноз, устанавливаемый врачами. Без потери общности можно считать, что целевой параметр является параметром дискретного типа с фиксированным множеством значений. Алгоритм строит ассоциативные правила, заключением которых является конкретное значение целевого параметра. Посылка правил задает набор свойств входных параметров базы данных. Исходная база данных приводится к специальному формату, в котором запись приведенной базы данных задается одним целым числом независимо от размера записи исходной базы данных. Помимо экономии памяти, такой формат позволяет полностью сохранять информацию о параметрах, представляющих исходную запись. Более важно то, что вычислительно сложные операции над записями, требуемые при вычислении характеристик правил, в этом формате выполняются практически мгновенно парой логических операций над целыми числами. Рассматриваются задачи и свойства алгоритма. Доказывается ряд утверждений относительно свойств алгоритма. Вводится понятие обобщенного критерия качества правил, что позволяет проводить ранжирование правил.
Ключевые слова:ассоциативные правила, алгоритм Априори, Data Mining, базы данных.
УДК:
004.65
Поступила в редакцию: 13.12.2023 Исправленный вариант: 27.01.2024