Аннотация:
В индустрии нередко возникает необходимость одновременно строить прогнозы по большим наборам временных рядов. Однако мы можем оказаться в ситуации, когда обучение отдельной модели для каждого из них невозможно или слишком затратно. Эта проблема в моделировании временных рядов остается без должного внимания. Средством ее решения может служить создание фундаментальной модели (foundation model), рассчитанной на прогнозирование в режимах zero-shot и few-shot. В данной работе мы рассматриваем ключевой вопрос: целесообразно ли обучать такую фундаментальную модель на синтетических данных или лучше использовать лишь ограниченное число реальных примеров. Наши эксперименты проведены только для регулярных временных рядов и свидетельствуют в пользу использования исключительно реальных рядов. Более того, выбор исходного набора данных существенно влияет на качество на этапе инференса. Если даже имеется доступ лишь к ограниченному количеству коротких временных рядов, их использование в рамках контролируемого обучения дает лучшие результаты, чем обучение на большем объеме синтетических данных.