RUS  ENG
Полная версия
ЖУРНАЛЫ // Труды института системного программирования РАН // Архив

Труды ИСП РАН, 2022, том 34, выпуск 6, страницы 179–184 (Mi tisp748)

Оценка языковой способности нейронных моделей на материале предикативного согласования в русском языке

К. А. Студеникина

Московский государственный университет имени М. В. Ломоносова

Аннотация: Исследование нацелено на то, чтобы изучить способность нейронных сетей моделировать грамматику, которая проявляется в функции автоматической оценки грамматичности языковых выражений. В данной работе моделируются правила предикативного согласования по числу в русском языке. Для обучения языковых моделей был создан датасет, включающий искусственно сгенерированные грамматичные и неграмматичные предложения. Мы используем трансферное обучение предобученных нейронных сетей. Результаты показывают, что все рассмотренные модели демонстрируют высокие результаты при дообучении на задачу оценки грамматичности. Точность классификации снижается для предложений с неодушевленными существительными, поскольку для них, в отличие от одушевленных существительных, наблюдается совпадение форм именительного и винительного падежа. Сложность синтаксической структуры оказывается значимой для русскоязычных моделей и модели для славянских языков, но не влияет на распределение ошибок для мультиязычных моделей.

Ключевые слова: языковая способность, языковые модели, трансферное обучение, искусственный интеллект, обработка естественного языка, оценка грамматичности

DOI: 10.15514/ISPRAS-2022-34(6)-14



© МИАН, 2024