RUS  ENG
Полная версия
ЖУРНАЛЫ // Вестник Тверского государственного университета. Серия: Прикладная математика // Архив

Вестник ТвГУ. Серия: Прикладная математика, 2011, выпуск 22, страницы 135–143 (Mi vtpmk266)

Математическая лингвистика

Метод определения неестественных текстов на основе характеристик тематического разнообразия

А. С. Павлов

Московский государственный университет им. М.В. Ломоносова, факультет вычислительной математики и кибернетики, г. Москва

Аннотация: В данной работе предлагается новый метод определение неестественных текстов, основанный на анализе разнообразия тематической структуры текстов и применении методов машинного обучения. Эффективность предложенного метода подтверждается экспериментально.

Ключевые слова: неестественные тексты, поисковый спам, тематическая структура текстов.

УДК: 681.513.7

Поступила в редакцию: 31.03.2011
Исправленный вариант: 20.05.2011



Реферативные базы данных:


© МИАН, 2024