Аннотация:
Машинное обучение широко применяется в задаче прогнозирования цен на акции публичных компаний. Для построения более точной прогностической модели необходимо учитывать не только исторические данные о ценах на акции, но и относящиеся к ним знания из внешнего мира. Такую ценную информацию может дать эмоциональная окраска финансовых новостей, связанных с компанией. Однако финансовые новости могут быть разделены на различные тематические группы, например, Macro (новости, относящиеся к теме “макроэкономика”), Market (новости о ситуации на различных рынках) или Product news (новости о продукте, который производит та или иная компания). В задачах исследования рынка обычно не принимается во внимание такая категоризация. В данной работе мы стремимся восполнить этот пробел и изучить эффект от учета разделения новостей на группы по тематическому признаку в задаче прогнозирования цен на акции публичных компаний. Сначала мы получаем индикаторы настроения финансовых новостей, затем классифицируем их поток на 20 заранее определенных тем с помощью предварительно обученной модели. Кроме того, мы проводим эксперименты с несколькими хорошо зарекомендовавшими себя моделями для прогнозирования временных рядов, включая темпоральную конволюционную сеть (Temporal Convolutional Network), D-линейную модель (D-Linear), трансформатор (Transformer) и темпоральный синтезирующий трансформатор (Temporal Fusion Transformer). Результаты нашего исследования показывают, что использование информации об эмоциональной окраске новостей из отдельных тематических групп способствует улучшению метрик работы моделей глубокого обучения по сравнению с подходом, когда рассматриваются все новости без какого-либо разделения.