RUS  ENG
Полная версия
ЖУРНАЛЫ // Автоматика и телемеханика // Архив

Автомат. и телемех., 2022, выпуск 12, страницы 44–62 (Mi at16096)

Тематический выпуск

Оптимизация весов модальностей в тематических моделях транзакционных данных

К. Я. Хрыльченко, К. В. Воронцов

ФИЦ «Информатика и управление» РАН, Москва

Аннотация: Современные модели обработки естественного языка, такие как трансформеры, работают с мультимодальными данными. В данной работе исследуются мультимодальные данные с помощью мультимодального тематического моделирования над транзакционными данными корпоративных клиентов банка. Предлагается определение важности модальности для модели, на основе которого рассматриваются улучшения для двух сценариев моделирования: сохранение максимального количества информации с помощью балансирования модальностей и автоматический подбор весов модальностей для оптимизации вспомогательных критериев на основе тематических представлений документов.
Предлагается модель добавления численных данных в тематические модели в виде модальностей: каждой теме сопоставляется нормальное распределение с обучаемыми параметрами. Демонстрируются существенные улучшения по сравнению со стандартными тематическими моделями на задаче моделирования корпоративных клиентов банка. На основе тематических представлений клиентов банка прогнозируется 90-дневная просрочка по кредиту.

Ключевые слова: мультимодальное тематическое моделирование, транзакционные данные, классификация, прогноз просрочки по кредиту.

Статья представлена к публикации членом редколлегии: А. А. Лазарев

Поступила в редакцию: 31.01.2022
После доработки: 18.05.2022
Принята к публикации: 29.06.2022

DOI: 10.31857/S0005231022120054


 Англоязычная версия: Automation and Remote Control, 2022, 83:12, 1908–1922


© МИАН, 2024