Аннотация:
Статья продолжает серию работ, посвященных технологии поддержки конкретно-исторических исследований (ПКИИ). Технология построена на принципах сотворчества и краудсорсинга и ориентирована на широкий круг не относящихся к профессиональным историкам и биографам пользователей. Статья посвящена дальнейшему развитию технологии за счет интеграции в нее механизма автоматизированного поиска аномалий в конкретно-исторических данных на базе кластерного анализа. Проведен анализ специфики конкретно-исторических данных и способов их представления в объектной модели технологии. Подробно рассмотрены методы оцифровки смешанных данных и используемых для них мер близости, оценены достоинства и недостатки алгоритмов кластеризации, применяемых для поиска аномалий. На основании проведенного анализа выработан подход к поиску аномалий в данных в технологии и намечены направления проверки эффективности выбранных алгоритмов и мер близости на реальных конкретно-исторических данных.
Ключевые слова:конкретно-историческое исследование, распределенная технология, аномалия, историко-биографический факт, кластеризация.