Аннотация:
Статья посвящена вопросу рассмотрения данных, содержащихся в Едином государственном фонде данных (ЕГФД) Федеральной службы России по гидрометеорологии и мониторингу окружающей среды (Росгидромет), как больших данных (“Big Data”), а также описанию технологий и инструментов для работы с данными ЕГФД. В ЕГФД хранятся данные как на бумажных носителях, так в электронном виде, по гидрометеорологии и смежным с ней областям (метеорологии, аэрологии, гидрологии, океанологии и др.). Особый исследовательский интерес для аналитиков данных и специалистов по обработке данных могут представлять первичные данные в электронном виде. Электронные первичные данные распределены по слоям. В работе представлено обоснование классификации данных ЕГФД как больших данных, также описаны особенности хранящихся в ЕГФД данных. Кроме того, в качестве примера больших данных приведены данные специализированных массивов для климатических исследований, расположенные в открытом доступе, хранимые и пополняемые одним из учреждений Росгидромета — Федеральным государственным бюджетным учреждением «Всероссийский научно-исследовательский институт гидрометеорологической информации — Мировой центр данных» (ФГБУ «ВНИИГМИ-МЦД»). Приведен перечень предполагаемых для разработки технологий и инструментов для повышения эффективности работы с данными ЕГФД.
Ключевые слова:Госфонд Росгидромета, большие данные, язык описания гидрометеорологических данных, технологии обработки данных, технологии конвертации данных.