Д. Н. Богомолов, С. Б. Плотников, “Возможности использования технологий Big Data при решении задач по обработке данных о загрязнении атмосферного воздуха”, Comp. nanotechnol., 2024, том 11, выпуск 1,страницы 162

ИНФОРМАТИКА И ИНФОРМАЦИОННЫЕ ПРОЦЕССЫ

Возможности использования технологий Big Data при решении задач по обработке данных о загрязнении атмосферного воздуха

Д. Н. Богомолов, С. Б. Плотников

МИРЭА – Российский технологический университет

Аннотация: Основная задача статьи – обоснование возможности использования технологий больших данных (Big Data) в сфере мониторинга атмосферного воздуха. В виде схемы представлена модель обработки больших данных, полученных с измерительных метеорологических газоанализаторных станций с использованием библиотеки PySpark для проведения дальнейших экспериментальных исследований. Выведены факторы, сопутствующие использованию Big Data в области мониторинга атмосферного воздуха, и проведено сравнение производительности библиотек Pandas и PySpark. Полученные результаты позволят в дальнейшем опираться на выведенные факторы и использовать наиболее оптимальные технологии работы с данными для построения предиктивных моделей машинного обучения в области анализа уровня загрязнения атмосферного воздуха. Последовательное использование больших данных и методов машинного обучения позволит обеспечить чистый и здоровый воздух для будущих поколений за счет более эффективной предиктивной аналитики. Данная статья имеет ценность для обучающихся и специалистов в области информационных технологий, в частности, в области обработки данных и машинного обучения.

Ключевые слова: большие данные, обработка данных, мониторинг атмосферного воздуха, прогнозирование загрязнений.

УДК: 004.67

DOI: 10.33693/2313-223X-2024-11-1-162-170