Аннотация:
Проведено сравнение классического метода экстремального градиентного бустинга, реализованного во фреймворке XGBoost (eXtreme Gradient Boosting, экстремальный градиентный бустинг) и категориальной модификации CatBoost (Categorical Boosting, категориальный бустинг), которая достаточно редко встречается в научных исследованиях. Предложены некоторые гибридные модели классификации регрессии для повышения точности заполнения пропусков в реальных данных на примере 14 станций в Германии. Достигнутая точность в задачах классификации составила до 92% при весьма умеренных значениях ошибок прогнозов в метрике RMSE (Root Mean-Square Error, среднеквадратичная ошибка). Гибридные методы превзошли по качеству предсказания простые модели классификации и регрессии. Развиваемые подходы могут быть успешно использованы как для непосредственного анализа метеорологических данных методами машинного обучения, так и для улучшения качества предсказания на основе физических моделей атмосферных процессов.