RUS  ENG
Полная версия
ЖУРНАЛЫ // Информационные технологии и вычислительные системы // Архив

ИТиВС, 2009, выпуск 1, страницы 23–37 (Mi itvs437)

МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ

Меры семантической близости статей Википедии и их применение к обработке текстов

П. Е. Велихов

Научно-исследовательский институт системных исследований Российской академии наук, г. Москва

Аннотация: Рассмотрены меры семантической близости статей Википедии и их применение к задачам обработки текстов и информационного поиска. Приведены требования к мерам семантической близости для задач вычисления близости между парой статей и для ранжирования всех статей Википедии относительно заданной. Предложены эвристические методы эффективного ранжирования для отдельного класса мер. Приведены экспериментальные данные, подтверждающие эффективность предложенного подхода. Кратко рассмотрены методы, реализованные в системе Texture.

Ключевые слова: семантическая близость, Википедия, анализ текстов, информационный поиск.



Реферативные базы данных:


© МИАН, 2025