RUS  ENG
Полная версия
ЖУРНАЛЫ // Препринты Института прикладной математики им. М. В. Келдыша РАН // Архив

Препринты ИПМ им. М. В. Келдыша, 2021, 058, 22 стр. (Mi ipmp2975)

Исследование грамматической неоднозначности наиболее частотных слов русского языка

Э. С. Клышинский, В. А. Бунтякова, О. В. Карпик


Аннотация: В своих предыдущих исследованиях мы обнаружили, что в европейских языках грамматическая неоднозначность наиболее частотных слов ведет себя несколько иначе, чем в более редких словах. В данном исследовании мы более подробно анализируем причины этого явления, уделяя особое внимание первой тысяче наиболее частотных токенов. Исследование современных систем снятия омонимии и синтаксического анализа показало, что всплеск разнообразия частей речи, который наблюдается в наиболее частотных слова, приводит к увеличению числа ошибок на выходе этих систем.

Ключевые слова: грамматическая неоднозначность, квантитативный анализ, статистика распределения, русский язык.

DOI: 10.20948/prepr-2021-58



© МИАН, 2024