Аннотация:
Отмечено, что в настоящее время растет число проектов открытых данных (ОД) — публикации в свободном доступе информации государственных органов или частных компаний для последующего использования. Один из барьеров в получении выгод от ОД состоит в наличии проблемы качества публикуемых данных. Проанализирована указанная проблема, причины ее появления, рассмотрены метрики и стратегии повышения качества ОД, предложена общая стратегия и ее имплементация для случаев наличия временного и категориального контекстов, предполагающие применение методов поиска аномалий.
Ключевые слова:открытые данные, качество данных, поиск аномалий.
УДК:519.25;519.248;004.6;005.6
Поступила в редакцию: 17.07.2018 Исправленный вариант: 24.12.2018 Принята в печать: 06.02.2019