RUS  ENG
Полная версия
ЖУРНАЛЫ // Информатика и автоматизация // Архив

Тр. СПИИРАН, 2014, выпуск 36, страницы 59–77 (Mi trspy749)

Эта публикация цитируется в 6 статьях

Разработка и исследование предметно независимого классификатора текстов по тональности

Ю. В. Рубцова

Институт систем информатики им. А. П. Ершова СО РАН

Аннотация: В статье представляется метод построения классификатора для классификации текстов по тональности на два и на три класса (положительные и негативные; положительные, нейтральные и негативные тексты). Представляются результаты экспериментов, показывающие высокую точность работы метода не зависимо от предметной области к которой принадлежит текст. Эффективность представленного метода подтверждается экспериментами на текстовой коллекции блогов с разметкой по оценочной тональности семинара РОМИП-2012. Для оценки используются метрики: precision, recall, accuracy и F-меры. Значение F-меры для предлагаемого метода при классификации на 2 класса составляет 93%. Помимо блоговой коллекции РОМИП-2012, используются коллекция новостей и коллекция текстов социальных сетей.

Ключевые слова: анализ тональности текстов; машинное обучение; классификация текстов; автоматическая классификация; извлечение классификационных признаков.

УДК: 004.912

DOI: 10.15622/sp.36.4



© МИАН, 2024