RUS  ENG
Полная версия
ЖУРНАЛЫ // Моделирование и анализ информационных систем // Архив

Модел. и анализ информ. систем, 2025, том 32, номер 3, страницы 282–297 (Mi mais852)

Artificial intelligence

Методология иерархического многозадачного обучения нейронных сетей типа ERNIE 3 для анализа и генерации русскоязычных текстов

Е. В. Тотмина, И. Бондаренко, А. В. Середкин

Новосибирский национальный исследовательский государственный университет, Новосибирск, Россия

Аннотация: Статья посвящена разработке методологии иерархического многозадачного обучения нейронных сетей, основанной на принципах архитектуры ERNIE 3, и экспериментальной апробации данной методологии на базе модели FRED-T5 для задач анализа и генерации текстов на русском языке. Иерархическое многозадачное обучение является перспективным подходом к созданию универсальных языковых моделей, способных эффективно решать разнообразные задачи обработки естественного языка (NLP). Предложенная методология объединяет преимущества специализированных энкодерных блоков для задач понимания текста (NLU) и общего декодера для генеративных задач (NLG), что позволяет повысить производительность модели и снизить вычислительные затраты. В работе проведён сравнительный анализ эффективности разработанной методологии на открытом бенчмарке Russian SuperGLUE с использованием предварительно обученной русскоязычной модели FRED-T5-1.7B. Экспериментальные результаты подтвердили существенное улучшение качества модели в режимах zero-shot и few-shot по сравнению с базовой конфигурацией. Дополнительно рассмотрены возможности практического применения разработанного подхода в решении реальных NLP-задач, а также даны рекомендации по дальнейшему развитию методологии и её интеграции в прикладные системы обработки русскоязычных текстов.

Ключевые слова: иерархическое многозадачное обучение, FRED-T5, обработка естественного языка, нейронные сети, генерация текста, анализ текста, zero-shot обучение, few-shot обучение, seq2seq модели.

УДК: 004.852

MSC: 68T50

Поступила в редакцию: 06.06.2025
Исправленный вариант: 26.08.2025
Принята в печать: 27.08.2025

DOI: 10.18255/1818-1015-2025-3-282-297



© МИАН, 2025