RUS  ENG
Полная версия
ЖУРНАЛЫ // Системы и средства информатики // Архив

Системы и средства информ., 2015, том 25, выпуск 1, страницы 20–33 (Mi ssi391)

Эта публикация цитируется в 2 статьях

Комбинирование тезаурусных и корпусных знаний для извлечения оценочных слов

Н. В. Лукашевич, И. И. Четверкин

НИВЦ Московского государственного университета им. М. В. Ломоносова

Аннотация: Описан комбинированный подход к извлечению оценочных слов в заданной предметной области. На первом этапе упорядоченный список оценочных слов извлекается из текстов предметной области на основе методов машинного обучения. На втором этапе полученный список уточняется за счет привлечения лексических знаний, описанных в тезаурусе русского языка. Данная комбинированная модель была обучена на предметной области отзывов о фильмах, а затем была перенесена на другие предметные области. Кроме того, на основе объединения оценочных списков данных предметных областей был получен улучшенный список оценочных слов в широкой области товаров и услуг ProductSentiRus+.

Ключевые слова: анализ тональности текстов; автоматическая обработка текстов; отзывы пользователей; тезаурус русского языка.

Поступила в редакцию: 20.01.2015

DOI: 10.14357/08696527150102



Реферативные базы данных:


© МИАН, 2024