М. А. Костерин, И. В. Парамонов, “Применение глубоких нейронных сетей для автоматического определения иронии в русскоязычных текстах”, Модел. и анализ информ. систем, 2024, том 31, номер 1,страницы 90

Эта публикация цитируется в 1 статье

Artificial intelligence

Применение глубоких нейронных сетей для автоматического определения иронии в русскоязычных текстах

М. А. Костерин, И. В. Парамонов

Ярославский государственный университет им. П.Г. Демидова, Ярославль, Россия

Аннотация: В работе исследуются автоматические методы классификации русскоязычных предложений на два класса: содержащие и не содержащие ироничный посыл. Рассматриваемые методы могут быть разделены на три категории: классификаторы на основе эмбеддингов языковых моделей, классификаторы с использованием информации о тональности и классификаторы с обучением эмбеддингов обнаружению иронии. Составными элементами классификаторов являются нейронные сети, такие как BERT, RoBERTa, BiLSTM, CNN, а также механизм внимания и полносвязные слои. Эксперименты по обнаружению иронии проводились с использованием двух корпусов русскоязычных предложений: первый корпус составлен из публицистических текстов из открытого корпуса OpenCorpora, второй корпус является расширением первого и дополнен ироничными предложениями с ресурса Wiktionary.
Лучшие результаты продемонстрировала группа классификаторов на основе чистых эмбеддингов языковых моделей с максимальным значением F-меры 0.84, достигнутым связкой из RoBERTa, BiLSTM, механизма внимания и пары полносвязных слоев в ходе экспериментов на расширенном корпусе. В целом использование расширенного корпуса давало результаты на 2–5% выше результатов на базовом корпусе. Достигнутые результаты являются лучшими для рассматриваемой задачи в случае русского языка и сравнимы с лучшими для английского.

Ключевые слова: обнаружение иронии, обнаружение сарказма, нейросетевой классификатор, глубокое обучение, обработка естественного языка, BERT.

УДК: 004.912

MSC: 68T50

Поступила в редакцию: 15.02.2024
Исправленный вариант: 23.02.2024
Принята в печать: 28.02.2024

DOI: 10.18255/1818-1015-2024-1-90-101