Аннотация:
Статья продолжает серию работ, посвященных технологии поддержки конкретно-исторических исследований (ПКИИ). Технология построена на принципах сотворчества и краудсорсинга и ориентирована на широкий круг не относящихся к профессиональным историкам и биографам пользователей. Показана целесообразность расширения перечня задач конкретно-исторического исследования, решаемых в рамках описанной технологии с применением методов машинного обучения. Отмечена особая важность подготовки данных в связи с фрагментарностью и противоречивостью конкретно-исторической информации. Данная {статья} посвящена специфике очистки конкретно-исторических данных и анализу возможности применения с этой {целью} механизмов и алгоритмов, уже интегрированных в технологию. Перечислены основные направления, по которым проводится очистка данных. Для каждого направления выявлены подходящие, уже включенные в технологию инструменты. Особое внимание уделено инструментам устранения несогласованности. Перечислены этапы очистки данных и приведена схема взаимодействия всех описанных в статье механизмов и алгоритмов.
Ключевые слова:конкретно-историческое исследование, распределенная технология, машинное обучение, очистка данных, несогласованность данных.