Аннотация:
Целью данного обзора является анализ глобальных тенденций создания массивных коллекций данных в мире и обеспечения возможности совместного использования таких коллекций при решении задач исследования и принятия решений в различных областях с интенсивным использованием данных (ОИИД) в России. Конкретный набор ОИИД, отобранный для обзора, включает астрономию, материаловедение, науки о Земле, геномику и протеомику, нейронауку. По каждой из рассмотренных ОИИД представлены крупные стратегические инициативы США и ЕС, примеры крупных коллекций данных в мире до 2025 г., известные проекты информационных и телекоммуникационных инфраструктур и центров данных. Включенный в обзор набор массивных коллекций данных, планируемых к получению в мире, предлагается использовать в качестве ориентира при планировании и развитии исследовательских инфраструктур для накопления и анализа данных, совместимых с зарубежными открытыми инфраструктурами в науке. В частности, рассматриваемые в обзоре коллекции данных, цели их создания и научные исследования, планируемые к осуществлению с их помощью, позволяют перейти к постановке и решению задач создания компонентов перспективных информационных и телекоммуникационных инфраструктур, таких как, например, средства концептуализации ОИИД, необходимые метамодели, средства обеспечения возможности повторного использования коллекций данных, воспроизводимости программ и потоков работ и др.
Ключевые слова:4-я парадигма; области с интенсивным использованием данных; исследовательские инфраструктуры; коллекции данных; большие данные.