RUS  ENG
Полная версия
ЖУРНАЛЫ // Информатика и автоматизация // Архив

Тр. СПИИРАН, 2016, выпуск 47, страницы 92–104 (Mi trspy893)

Эта публикация цитируется в 3 статьях

Методы управления и обработки информации

Многозначная классификация текстовых документов с использованием вероятностного тематического моделирования ml-PLSI

С. Н. Карпович

ООО "Рамблер Интернет Холдинг"

Аннотация: В работе рассмотрен подход к многозначной классификации текстовых документов на основе вероятностного тематического моделирования. На базе корпуса SCTM-ru построена тематическая модель методом обучения с учителем, приведен алгоритм многозначной классификации. Описан состав программного прототипа, реализующего предложенный подход.

Ключевые слова: многозначная (нечеткая) классификация; обучение с учителем; тематическое моделирование; обработка текста на естественном языке.

УДК: 004.912

DOI: 10.15622/sp.47.5



Реферативные базы данных:


© МИАН, 2024