Аннотация:
Предлагается подход к автоматическому извлечению оценочных слов
для заданной предметной области на основе порождения признаков из нескольких
текстовых коллекций. Полученные оценочные слова применяются в задаче
классификации отзывов на три класса, в которой необходимо разделить отзывы на
классы: “понравилось”, “понравилось, но есть замечания”, “не понравилось”.
В задаче классификации исследуются разные виды весов для слов, учитываются знаки
препинания и слова-операторы, которые могут менять тональность следующих за ними
слов. Работа частично поддержана грантом РФФИ № 11-07-00588-а.