Аннотация:
Статья продолжает серию работ, посвященных технологии поддержки конкретно-исторических исследований (ПКИИ). Технология построена на принципах сотворчества и краудсорсинга и ориентирована на широкий круг не относящихся к профессиональным историкам и биографам пользователей. Статья посвящена применению метода деревьев классификации на базе алгоритма CHAID для автоматического заполнения информационных лакун в наборе исторических фактов с целью определения потенциально перспективных направлений исследования. Приведено описание алгоритма и сделана оценка достоверности его результатов при высокой доле пропущенных значений в данных. Оценена доля пропусков в основных источниках множественных фактов и сделан вывод принципиальной применимости и эффективности алгоритма с учетом специфики технологии. Также показано, что алгоритм CHAID позволяет развить и дополнить существующие в технологии средства определения аномалий в конкретно-исторических данных.