Аннотация:
В данной работе предлагается подход к кластеризации коротких текстовых фрагментов, основанный на особом способе представления объектов в пространстве признаков на базе иерархического классификатора. Также в работе предлагается набор критериев оценки качества кластеризации, позволяющий всесторонне оценить получаемое решение. Проведенные результаты экспериментов показывают способность данного подхода существенно улучшить качество кластеризации.
Ключевые слова:кластеризация, нечеткий классификатор, обработка естественного языка, критерии оценки кластеризации.
УДК:
004.4, 681.3
Поступила в редакцию: 09.10.2017 Исправленный вариант: 15.12.2017