RUS  ENG
Полная версия
ЖУРНАЛЫ // Записки научных семинаров ПОМИ // Архив

Зап. научн. сем. ПОМИ, 2024, том 540, страницы 5–26 (Mi znsl7541)

Towards Russian summarization: can architecture solve data limitations problems?

[Русскоязычное автоматическое реферирование: можно ли решить проблему ограниченности данных архитектурой?]

A. Akhmetgareevaa, A. Abramova, I. Kuleshovb, V. Leschuka, A. Fenogenovaa

a SberDevices
b HSE University, St. Petersburg

Аннотация: В данной работе исследуется проблема автоматического реферирования, акцентируя внимание на её значимость, вызовы и методы, особенно в контексте русского языка. Мы выделяем ограничения текущих метрик оценки и наборов данных, которые представляют различные сценарии реферирования. В работе изучены различные подходы, включая форматы контролируемого обучения, сравнение моделей, предназначенных для русского языка, и обладающих кросс-языковыми возможностями, а также влияние настройки обучения с подкреплением на конечные результаты. Вклад работы включает изучение задачи реферирования для русского языка, публикацию набора данных на основе инструкций и лучшей открытой модели, а также перспективы для дальнейших достижений в данной области. Библ. – 43 назв.

Ключевые слова: абстрактивное реферирование, русский язык, языковые модели, RLHF.

Поступило: 15.11.2024

Язык публикации: английский



© МИАН, 2025