Аннотация:
Статья относится к области разработки методов и средств интеграции данных. Один из важнейших этапов интеграции данных — это слияние данных, объединение записей, относящихся к одной и той же сущности реального мира, в одну запись с разрешением конфликтов для каждого из атрибутов. Рассмотрена формальная постановка задачи слияния данных, приведен краткий обзор основных существующих групп методов слияния данных. Предложен подход к реализации этапа слияния данных в расширяемой системе интеграции разнородных источников данных в распределенной вычислительной среде, рассмотрена его программная архитектура и основные идеи реализации.
Ключевые слова:слияние данных, распределенные вычислительные среды.