Аннотация:
Рассмотрены меры семантической близости статей Википедии и их применение к задачам обработки текстов и информационного поиска. Приведены требования к мерам семантической близости для задач вычисления близости между парой статей и для ранжирования всех статей Википедии относительно заданной. Предложены эвристические методы эффективного ранжирования для отдельного класса мер. Приведены экспериментальные данные, подтверждающие эффективность предложенного подхода. Кратко рассмотрены методы, реализованные в системе Texture.
Ключевые слова:
семантическая близость, Википедия, анализ текстов, информационный поиск.