RUS  ENG
Полная версия
ЖУРНАЛЫ // Программные системы: теория и приложения // Архив

Программные системы: теория и приложения, 2025, том 16, выпуск 1, страницы 83–130 (Mi ps464)

Искусственный интеллект и машинное обучение

Multimodal stock price prediction: a case study of the Russian securities market

[Мультимодальное предсказание цен акций на примере российского рынка ценных бумаг]

K. Yu. Khubiev, M. E. Semenov

Sirius University of Science and Technology, Sirius, Russia

Аннотация: Классические методы прогнозирования цен активов в основном опираются на числовые данные, такие как временные ряды цен, объемы торгов, распределение лимитированных ордеров и индикаторы технического анализа. Однако новостной фон играет существенную роль в формировании цен, что делает актуальным развитие мультимодальных подходов, объединяющих текстовые и числовые данные для повышения точности предсказаний.
В данной работе решается задача прогнозирования цен финансовых активов с использованием мультимодального подхода, объединяющего временные ряды цен и текстовую модальность новостного потока. Для исследований был собран уникальный набор данных, включающий временные ряды для 176 акций российских компаний, торгуемых на Московской бирже, и 79555 русскоязычных финансовых новостей.
Для обработки текстовых данных использовались предобученные модели RuBERT и Vikhr-Qwen2.5-0.5b-Instruct (большая языковая модель), временные ряды и векторизованная текстовая модальность обрабатывались рекуррентной нейронной сетью LSTM. В ходе экспериментов сравнивались модели с одной модальностью и двумя модальностями, а также различные методы агрегации векторных представлений текстов.
Качество прогнозов оценивалось по двум ключевым метрикам: точности (accuracy) предсказания направления изменения цены (рост/снижение) и средней абсолютной процентной ошибке (MAPE) отклонения предсказанной цены от истинной. Эксперименты показали, что добавление текстовой модальности позволяет уменьшить значение MAPE на 55%.
Полученный мультимодальный набор данных представляет ценность для дальнейшей адаптации языковых моделей в финансовой сфере. Перспективные направления исследований включают оптимизацию параметров текстовой модальности, таких как временное окно, тональность и хронологический порядок новостных сообщений. (Связанные тексты статьи на английском и на русском языках).

Ключевые слова и фразы: мультимодальная предсказательная модель, количественные финансы, машинное обучение.

УДК: 004.832: 336.761
ББК: 65.262.2

MSC: Primary 68T30; Secondary 68T50, 91884

Поступила в редакцию: 24.12.2024
Подписана в печать : 27.02.2025

Язык публикации: русский и английский

DOI: 10.25209/2079-3316-2025-16-1-83-130



© МИАН, 2025