Искусственный интеллект и машинное обучение
Multimodal stock price prediction: a case study of the Russian securities market
[Мультимодальное предсказание цен акций на примере российского рынка ценных бумаг]
K. Yu. Khubiev,
M. E. Semenov Sirius University of Science and Technology, Sirius, Russia
Аннотация:
Классические методы прогнозирования цен активов в основном опираются на числовые данные, такие как временные ряды цен, объемы торгов, распределение лимитированных ордеров и индикаторы технического анализа. Однако новостной фон играет существенную роль в формировании цен, что делает актуальным развитие мультимодальных подходов, объединяющих текстовые и числовые данные для повышения точности предсказаний.
В данной работе решается задача прогнозирования цен финансовых активов с использованием мультимодального подхода, объединяющего временные ряды цен и текстовую модальность новостного потока. Для исследований был собран уникальный набор данных, включающий временные ряды для 176 акций российских компаний, торгуемых на Московской бирже, и
79555
русскоязычных финансовых новостей.
Для обработки текстовых данных использовались предобученные модели RuBERT и Vikhr-Qwen2.5-0.5b-Instruct (большая языковая модель), временные ряды и векторизованная текстовая модальность обрабатывались рекуррентной нейронной сетью LSTM. В ходе экспериментов сравнивались модели с одной модальностью и двумя модальностями, а также различные методы агрегации векторных представлений текстов.
Качество прогнозов оценивалось по двум ключевым метрикам: точности (accuracy) предсказания направления изменения цены (рост/снижение) и средней абсолютной процентной ошибке (MAPE) отклонения предсказанной цены от истинной. Эксперименты показали, что добавление текстовой модальности позволяет уменьшить значение MAPE на 55%.
Полученный мультимодальный набор данных представляет ценность для дальнейшей адаптации языковых моделей в финансовой сфере. Перспективные направления исследований включают оптимизацию параметров текстовой модальности, таких как временное окно, тональность и хронологический порядок новостных сообщений. (
Связанные тексты статьи на английском и на русском языках).
Ключевые слова и фразы:
мультимодальная предсказательная модель, количественные финансы, машинное обучение.
УДК:
004.832: 336.761
ББК:
65.262.2
MSC: Primary
68T30; Secondary
68T50,
91884 Поступила в редакцию: 24.12.2024
Подписана в печать : 27.02.2025
Язык публикации: русский и английский
DOI:
10.25209/2079-3316-2025-16-1-83-130