RUS  ENG
Полная версия
ЖУРНАЛЫ // Информационные технологии и вычислительные системы // Архив

ИТиВС, 2010, выпуск 2, страницы 42–49 (Mi itvs12)

ОБРАБОТКА ИНФОРМАЦИИ

Задача кластеризации текстовых документов

М. В. Хачумов

Российский университет дружбы народов

Аннотация: В статье рассмотрены вопросы совершенствования технологии кластеризации текстовых документов на основе оптимизации числа кластеров и их первоначального размещения, а также выбора наиболее адекватных метрик. Полученные в ходе экспериментов результаты подтверждают эффективность предложенного подхода.

Ключевые слова: текст, кластеризация, класс, вектор, метрика, центр кластера, рубрика, эксперимент.



© МИАН, 2024