Аннотация:
Статья посвящена использованию метода коллективного разрешения сущностей, основанного на новом алгоритме реляционной кластеризации, представляющем собой модификацию жадного алгоритма агломеративной кластеризации, в конкретно-историческом исследовании при обработке номинативных источников. Предложен метод поиска оптимальных значений параметров алгоритма коллективного разрешения сущностей для задач, связанных с конкретно-историческими исследованиями. Метод основан на анализе специфики конкретно-исторических данных, их сравнении с тестовыми данными, для которых имеются оценки эффективности алгоритма, и процедуре нахождения оптимальных параметров процессов по схеме Гаусса–Зайделя, заключающемся в последовательном поиске оптимума функции поочередно по каждой переменной. Применение предложенного метода делает возможным использование рассматриваемого алгоритма разрешения сущностей в реальных конкретно-исторических исследованиях в задачах автоматизированного связывания записей в номинативных источниках.