RUS  ENG
Полная версия
ЖУРНАЛЫ // Системы и средства информатики // Архив

Системы и средства информ., 2023, том 33, выпуск 2, страницы 132–141 (Mi ssi891)

Применение алгоритма CHAID в технологии поддержки конкретно-исторических исследований

И. М. Адамович, О. И. Волков

Федеральный исследовательский центр «Информатика и управление» Российской академии наук

Аннотация: Статья продолжает серию работ, посвященных технологии поддержки конкретно-исторических исследований (ПКИИ). Технология построена на принципах сотворчества и краудсорсинга и ориентирована на широкий круг не относящихся к профессиональным историкам и биографам пользователей. Статья посвящена применению метода деревьев классификации на базе алгоритма CHAID для автоматического заполнения информационных лакун в наборе исторических фактов с целью определения потенциально перспективных направлений исследования. Приведено описание алгоритма и сделана оценка достоверности его результатов при высокой доле пропущенных значений в данных. Оценена доля пропусков в основных источниках множественных фактов и сделан вывод принципиальной применимости и эффективности алгоритма с учетом специфики технологии. Также показано, что алгоритм CHAID позволяет развить и дополнить существующие в технологии средства определения аномалий в конкретно-исторических данных.

Ключевые слова: конкретно-историческое исследование, распределенная технология, алгоритм CHAID, пропущенные данные, аномалии.

Поступила в редакцию: 17.01.2023

DOI: 10.14357/08696527230213



© МИАН, 2024