Аннотация:
Данное исследование посвящено методам прогнозирования рынка труда ИТ-вакансий, в рамках которого изучаются вопросы выявления трендов, анализа остатков и сезонности временных рядов. В данном работе авторы основное внимание уделяют влиянию метода скользящего окна на модели прогнозирования временного ряда. Использование такого подхода предобработки данных направлен на повышение точности моделей машинного обучения для прогнозирования временных рядов. Рассматриваемый метод основывается на разбиении непрерывного временного ряда на множество последовательных и пересекающихся периодов с фиксированным размером, что позволяет моделям прогнозирования эффективно отслеживать временные характеристики. В работе был проведен эксперимент по оценке влияния использования метода скользящего окна в сочетании с различными моделями прогнозирования на качество прогноза ИТ-вакансий на наборе данных, содержащем 1 048 576 строк с информацией о вакансиях. В эксперименте в качестве моделей прогнозирования использовались LSTM, ARIMA, SARIMA и модель Холта. Для оценки качества моделей применялись метрики MSE, RMSE и MAE. Такое сочетание техники предобработки и модели обеспечивает устойчивость качества прогноза к чувствительности данных и адаптированность к резким изменениям в данных временного ряда, что значительно снижает ошибки прогнозирования по качественным показателям. Эксперимент показал, что модель LSTM оказалась наиболее эффективной благодаря способности более глубоко изучать сложные закономерности и выявлять долгосрочные зависимости, продемонстрировав прирост качества базовой модели с использованием метода скользящего окна по метрике MAE на 0,248 условные единицы, по MSE – на 2,649, по RMSE – на 0,162, по сравнению с базовой моделью (без скользящего окна). Таким образом, авторы работы показывают, что методы скользящего окна весьма полезны для построения устойчивых и адаптивных моделей прогнозирования.
Ключевые слова:
скользящее окно, прогнозирование временных рядов, машинное обучение, рынок ИТ-вакансий, тренды и сезонность, точность модели.