RUS  ENG
Полная версия
ЖУРНАЛЫ // Системы и средства информатики // Архив

Системы и средства информ., 2023, том 33, выпуск 3, страницы 149–160 (Mi ssi904)

Эта публикация цитируется в 1 статье

Очистка данных в технологии поддержки конкретно-исторических исследований

И. М. Адамович, О. И. Волков

Федеральный исследовательский центр «Информатика и управление» Российской академии наук

Аннотация: Статья продолжает серию работ, посвященных технологии поддержки конкретно-исторических исследований (ПКИИ). Технология построена на принципах сотворчества и краудсорсинга и ориентирована на широкий круг не относящихся к профессиональным историкам и биографам пользователей. Показана целесообразность расширения перечня задач конкретно-исторического исследования, решаемых в рамках описанной технологии с применением методов машинного обучения. Отмечена особая важность подготовки данных в связи с фрагментарностью и противоречивостью конкретно-исторической информации. Данная {статья} посвящена специфике очистки конкретно-исторических данных и анализу возможности применения с этой {целью} механизмов и алгоритмов, уже интегрированных в технологию. Перечислены основные направления, по которым проводится очистка данных. Для каждого направления выявлены подходящие, уже включенные в технологию инструменты. Особое внимание уделено инструментам устранения несогласованности. Перечислены этапы очистки данных и приведена схема взаимодействия всех описанных в статье механизмов и алгоритмов.

Ключевые слова: конкретно-историческое исследование, распределенная технология, машинное обучение, очистка данных, несогласованность данных.

Поступила в редакцию: 02.05.2023

DOI: 10.14357/08696527230313



© МИАН, 2024