A. Akhmetgareeva, A. Abramov, I. Kuleshov, V. Leschuk, A. Fenogenova, “Towards Russian summarization: can architecture solve data limitations problems?”, Зап. научн. сем. ПОМИ, 2024, том 540,страницы 5

Towards Russian summarization: can architecture solve data limitations problems?

[Русскоязычное автоматическое реферирование: можно ли решить проблему ограниченности данных архитектурой?]

A. Akhmetgareeva^a, A. Abramov^a, I. Kuleshov^b, V. Leschuk^a, A. Fenogenova^a

^a SberDevices
^b HSE University, St. Petersburg

Аннотация: В данной работе исследуется проблема автоматического реферирования, акцентируя внимание на её значимость, вызовы и методы, особенно в контексте русского языка. Мы выделяем ограничения текущих метрик оценки и наборов данных, которые представляют различные сценарии реферирования. В работе изучены различные подходы, включая форматы контролируемого обучения, сравнение моделей, предназначенных для русского языка, и обладающих кросс-языковыми возможностями, а также влияние настройки обучения с подкреплением на конечные результаты. Вклад работы включает изучение задачи реферирования для русского языка, публикацию набора данных на основе инструкций и лучшей открытой модели, а также перспективы для дальнейших достижений в данной области. Библ. – 43 назв.

Ключевые слова: абстрактивное реферирование, русский язык, языковые модели, RLHF.

Поступило: 15.11.2024

Язык публикации: английский