Аннотация:
В работе рассмотрен подход к многозначной классификации текстовых документов на основе вероятностного тематического моделирования. На базе корпуса SCTM-ru построена тематическая модель методом обучения с учителем, приведен алгоритм многозначной классификации. Описан состав программного прототипа, реализующего предложенный подход.
Ключевые слова:многозначная (нечеткая) классификация; обучение с учителем; тематическое моделирование; обработка текста на естественном языке.