RUS  ENG
Полная версия
ЖУРНАЛЫ // Информатика и автоматизация // Архив

Тр. СПИИРАН, 2012, выпуск 23, страницы 231–253 (Mi trspy544)

Эта публикация цитируется в 1 статье

Количественный анализ лексики русского WordNet и викисловарей

А. В. Смирнов, В. М. Круглов, А. А. Крижановский, Н. Б. Луговая, А. А. Карпов, И. С. Кипяткова

Санкт-Петербургский институт информатики и автоматизации РАН

Аннотация: В работе выполнен количественный анализ лексики русского языка по данным тезауруса Русский WordNet и двух электронных словарей (Русский Викисловарь и Английский Викисловарь). Сравнивается объём словарей и распределение слов русского языка по частям речи. Приводится соотношение многозначных слов и слов с одним значением, а также распределение русских слов по числу значений. Анализ распределения числа значений выявил проблему Английского Викисловаря – отсутствие или недостаточная проработка многозначных русских слов с числом значений больше четырёх (по сравнению со словами Русского Викисловаря). Эксперименты показывают, что лингвистические ресурсы, созданные энтузиастами, демонстрируют те же закономерности, что и традиционные словари.

Ключевые слова: вычислительная лингвистика, лексикография, лексический анализ, русский язык.

УДК: 004.912

PACS: 01.30.Kj

MSC: 68T50

Поступила в редакцию: 15.10.2012



© МИАН, 2024