Аннотация:
В данной работе предлагается новый метод определение неестественных текстов, основанный на анализе разнообразия тематической структуры текстов и применении методов машинного обучения. Эффективность предложенного метода подтверждается экспериментально.
Ключевые слова:неестественные тексты, поисковый спам, тематическая структура текстов.
УДК:
681.513.7
Поступила в редакцию: 31.03.2011 Исправленный вариант: 20.05.2011