RUS  ENG
Полная версия
ЖУРНАЛЫ // Системы и средства информатики // Архив

Системы и средства информ., 2024, том 34, выпуск 1, страницы 128–138 (Mi ssi930)

Эта публикация цитируется в 1 статье

Коллективное разрешение сущностей в технологии поддержки конкретно-исторических исследований

И. М. Адамович, О. И. Волков

Федеральный исследовательский центр «Информатика и управление» Российской академии наук

Аннотация: Статья посвящена дальнейшему развитию распределенной технологии поддержки конкретно-исторических исследований (ПКИИ), основанной на принципах краудсорсинга и ориентированной на широкий круг не относящихся к профессиональным историкам и биографам пользователей. Развитие осуществляется за счет включения в технологию алгоритма разрешения сущностей при обработке номинативных документов, осуществляющего коллективное разрешение, при котором сущности для совпадающих ссылок определяются совместно, а не независимо, и представляющего собой модификацию жадного алгоритма агломеративной кластеризации. Приведены подробное описание подхода, лежащего в основе алгоритма, и его высокоуровневый псевдокод. Представлен анализ его эффективности на данных с различной степенью неоднозначности имен, оценена степень неоднозначности имен конкретно-исторических данных. Сделан вывод о целесообразности включения алгоритма в технологию. Намечены направления дальнейших исследований по определению настраиваемых параметров алгоритма.

Ключевые слова: конкретно-историческое исследование, распределенная технология, разрешение сущностей, жадный алгоритм, мера реляционного сходства.

Поступила в редакцию: 09.01.2024

DOI: 10.14357/08696527240111



© МИАН, 2024