RUS  ENG
Полная версия
ЖУРНАЛЫ // Доклады Российской академии наук. Математика, информатика, процессы управления // Архив

Докл. РАН. Матем., информ., проц. упр., 2023, том 514, номер 2, страницы 385–394 (Mi danma482)

СПЕЦИАЛЬНЫЙ ВЫПУСК: ТЕХНОЛОГИИ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА И МАШИННОГО ОБУЧЕНИЯ

Получаем ли мы пользу от категоризации потока новостей в задаче прогнозирования цен акций?

Т. Д. Куликоваa, Е. Ю. Ковтунb, С. А. Буденныйc

a Национальный исследовательский университет "Высшая школа экономики", факультет компьютерных наук, Москва, Россия
b Лаборатория искусственного интеллекта Sber AI Lab, Москва, Россия
c Институт искусственного интеллекта AIRI, Москва, Россия

Аннотация: Машинное обучение широко применяется в задаче прогнозирования цен на акции публичных компаний. Для построения более точной прогностической модели необходимо учитывать не только исторические данные о ценах на акции, но и относящиеся к ним знания из внешнего мира. Такую ценную информацию может дать эмоциональная окраска финансовых новостей, связанных с компанией. Однако финансовые новости могут быть разделены на различные тематические группы, например, Macro (новости, относящиеся к теме “макроэкономика”), Market (новости о ситуации на различных рынках) или Product news (новости о продукте, который производит та или иная компания). В задачах исследования рынка обычно не принимается во внимание такая категоризация. В данной работе мы стремимся восполнить этот пробел и изучить эффект от учета разделения новостей на группы по тематическому признаку в задаче прогнозирования цен на акции публичных компаний. Сначала мы получаем индикаторы настроения финансовых новостей, затем классифицируем их поток на 20 заранее определенных тем с помощью предварительно обученной модели. Кроме того, мы проводим эксперименты с несколькими хорошо зарекомендовавшими себя моделями для прогнозирования временных рядов, включая темпоральную конволюционную сеть (Temporal Convolutional Network), D-линейную модель (D-Linear), трансформатор (Transformer) и темпоральный синтезирующий трансформатор (Temporal Fusion Transformer). Результаты нашего исследования показывают, что использование информации об эмоциональной окраске новостей из отдельных тематических групп способствует улучшению метрик работы моделей глубокого обучения по сравнению с подходом, когда рассматриваются все новости без какого-либо разделения.

Ключевые слова: финансовые новости, фондовый рынок, BERT, тематическая классификация, анализ эмоциональной окрашенности текста, прогнозирование временных рядов, глубокое обучение, внешние данные.

УДК: 517.54

Статья представлена к публикации: А. А. Шананин
Поступило: 04.09.2023
После доработки: 08.09.2023
Принято к публикации: 18.10.2023

DOI: 10.31857/S2686954323601926


 Англоязычная версия: Doklady Mathematics, 2023, 108:suppl. 2, S503–S510

Реферативные базы данных:


© МИАН, 2024