Аннотация:
При обеспечении взаимодействия или объединении разнородных информационных систем возникает задача идентификации сущностей, обеспечивающая установление идентичности записей, описывающих один и тот же объект реального мира в разных системах. Эта задача не может быть эффективно решена детерминированными алгоритмами. Данная статья описывает подход на основе машинного обучения для получения правил идентификации сущностей на основе деревьев принятия решений.
Ключевые слова:идентификация сущностей, распознавание сущностей, машинное обучение, дерево принятия решений, интеграция информационных систем.
Поступила в редакцию: 31.08.2017 Исправленный вариант: 12.10.2017