Аннотация:
В работе анализируются особенности обучающих данных в новых классах приложений, в которых для обнаружения знаний необходимо использовать методы анализа ассоциаций для случая, когда обучающие данные представлены в объектных базах данных, т.е. представлены множеством взаимосвязанных таблиц реляционной базы данных с онтологией на мета уровне. Предлагается алгоритм агрегирования “сырых” обучающих данных, который позволяет получить более экономное и более информативное их представление. В свою очередь, это позволяет повысить эффективность анализа данных при использовании “классических” методов, а также решать ряд новых задач, в частности, задач причинного анализа данных. Предложенный алгоритм демонстрируется на конкретном примере.
Ключевые слова:интеллектуальный анализ данных и обнаружение закономерностей, анализ ассоциаций, объектные базы данных, онтология, агрегирование обучающих данных.