RUS  ENG
Полная версия
ЖУРНАЛЫ // Вычислительные методы и программирование // Архив

Выч. мет. программирование, 2011, том 12, выпуск 4, страницы 73–81 (Mi vmp221)

Программирование

Извлечение и использование оценочных слов в задаче классификации отзывов на три класса

Н. В. Лукашевичa, И. И. Четвёркинb

a Научно-исследовательский вычислительный центр, Московский государственный университет им. М.В. Ломоносова
b Московский государственный университет им. М.В. Ломоносова, факультет вычислительной математики и кибернетики

Аннотация: Предлагается подход к автоматическому извлечению оценочных слов для заданной предметной области на основе порождения признаков из нескольких текстовых коллекций. Полученные оценочные слова применяются в задаче классификации отзывов на три класса, в которой необходимо разделить отзывы на классы: “понравилось”, “понравилось, но есть замечания”, “не понравилось”. В задаче классификации исследуются разные виды весов для слов, учитываются знаки препинания и слова-операторы, которые могут менять тональность следующих за ними слов. Работа частично поддержана грантом РФФИ № 11-07-00588-а.

Ключевые слова: извлечение знаний из текстов; извлечение оценочных слов; классификация отзывов; машинное обучение.

УДК: 004.853



© МИАН, 2024