RUS  ENG
Полная версия
ЖУРНАЛЫ // Системы и средства информатики // Архив

Системы и средства информ., 2024, том 34, выпуск 2, страницы 123–133 (Mi ssi940)

Метод поиска оптимальных значений параметров алгоритма разрешения сущностей для конкретно-исторических данных

И. М. Адамович, О. И. Волков

Федеральный исследовательский центр «Информатика и управление» Российской академии наук

Аннотация: Статья посвящена использованию метода коллективного разрешения сущностей, основанного на новом алгоритме реляционной кластеризации, представляющем собой модификацию жадного алгоритма агломеративной кластеризации, в конкретно-историческом исследовании при обработке номинативных источников. Предложен метод поиска оптимальных значений параметров алгоритма коллективного разрешения сущностей для задач, связанных с конкретно-историческими исследованиями. Метод основан на анализе специфики конкретно-исторических данных, их сравнении с тестовыми данными, для которых имеются оценки эффективности алгоритма, и процедуре нахождения оптимальных параметров процессов по схеме Гаусса–Зайделя, заключающемся в последовательном поиске оптимума функции поочередно по каждой переменной. Применение предложенного метода делает возможным использование рассматриваемого алгоритма разрешения сущностей в реальных конкретно-исторических исследованиях в задачах автоматизированного связывания записей в номинативных источниках.

Ключевые слова: конкретно-историческое исследование, распределенная технология, разрешение сущностей, параметры алгоритма, мера реляционного сходства.

Поступила в редакцию: 15.03.2024

DOI: 10.14357/08696527240209



© МИАН, 2024