Аннотация:
Данное исследование посвящено проблеме построения агрегированных прогнозов объемов железнодорожных грузоперевозок. Для получения агрегированных прогнозов требуется кластеризовать временны́е ряды таким образом, чтобы распределения временны́х рядов внутри кластера совпадали. При решении задачи кластеризации требуется оценить близость между временны́ми рядами, исходя из их эмпирических распределений. Вводится критерий принадлежности временны́х рядов одному распределению, основанный на расстоянии Кульбака–Лейблера между гистограммами временны́х рядов. Приводится теоретическое и практическое исследование предложенного критерия. Решается задача кластеризации временны́х рядов на основе матрицы парных расстояний между ними.
Ключевые слова:эмпирическая функция распределения; расстояние между гистограммами; расстояние Кульбака–Лейблера; задача двух выборок.