Аннотация:
Формирование клиентских групп и извлечение информации для этих групп являются важными задачами онлайн-бизнеса, так как это позволяет наиболее полно применить методики маркетинга. Частные лица могут быть лично обслужены группами, в соответствии с выявленными интересами и предпочтениями. В данной статье мы предлагаем способ определения и создания пользовательских групп путем обработки данных использования сайтов. Используя данные журнала веб-сервера, мы заходим на выбранный сайт, просматриваем и обрабатываем текстовый контент страниц сайта. Данный подход базируется на технологии обработки естественного языка и использует методы кластеризации текстовых документов. Экспериментальное тестирование данного метода было проведено с помощью программного продукта RapidMiner и данных посещения сайта болгарского Интернет-магазина.
Ключевые слова:кластеризация текстов, группы, анализ текстов, log-файл, RapidMiner.