Аннотация:
В статье рассмотрены вопросы совершенствования технологии кластеризации текстовых документов на основе оптимизации числа кластеров и их первоначального размещения, а также выбора наиболее адекватных метрик. Полученные в ходе экспериментов результаты подтверждают эффективность предложенного подхода.
Ключевые слова:текст, кластеризация, класс, вектор, метрика, центр кластера, рубрика, эксперимент.