RUS  ENG
Полная версия
ЖУРНАЛЫ // Информационные технологии и вычислительные системы // Архив

ИТиВС, 2012, выпуск 3, страницы 93–102 (Mi itvs92)

ПРИКЛАДНЫЕ АСПЕКТЫ ИНФОРМАТИКИ

Метод автоматической классификации коротких текстовых сообщений

Э. Мбайкоджиa, А. А. Дральb, И. В. Соченковcd

a Российский университет дружбы народов
b МГУ им. Ломоносова
c ИСА РАН
d ООО "Технологии системного анализа"

Аннотация: В статье представлены результаты исследования в области классификации коротких текстовых документов. Проанализированы методы классификации на основе анализа распределения лексических дескрипторов естественного языка. Описан метод оценки информационной значимости в текстах естественного языка. Представлен метод классификации текстовых документов на основе характеристики тематической значимости.

Ключевые слова: классификация коротких текстовых документов, классификация по метаданным, мультиномиальная модель, метод опорных векторов, TF, IDF, характеристика тематической значимости.



© МИАН, 2024