RUS  ENG
Полная версия
ЖУРНАЛЫ // Вестник Удмуртского университета. Математика. Механика. Компьютерные науки // Архив

Вестн. Удмуртск. ун-та. Матем. Мех. Компьют. науки, 2021, том 31, выпуск 1, страницы 132–148 (Mi vuu760)

Эта публикация цитируется в 1 статье

КОМПЬЮТЕРНЫЕ НАУКИ

Ранжирование документов при полнотекстовом поиске с учетом расстояния с использованием индексов с многокомпонентными ключами

А. Б. Веретенников

Уральский федеральный университет, 620083, Россия, г. Екатеринбург, пр. Ленина, 51

Аннотация: Рассматривается задача полнотекстового поиска с учетом расстояния. Применение индексов с многокомпонентными ключами позволяет существенно ускорить обработку запросов, включающих часто встречающиеся слова, в сравнении с обычными инвертированными индексами. Было показано, что если запросы состоят из очень часто встречающихся слов, то время поиска может быть сокращено в 130 раз. В данной статье изучается влияние на точность поиска, выдачу в результатах поиска релевантных документов, архитектуры индексов с многокомпонентными ключами. Рассмотрен ряд методов определения релевантности документов разных авторов. Каждый метод применен при поиске в обычном индексе, а затем при поиске с использованием индексов многокомпонентных ключей. Результаты экспериментов подтверждают, что для ряда методов расчета релевантности поиск с использованием индексов многокомпонентных ключей предоставляет близкие результаты при сравнении с поиском в обычном индексе.

Ключевые слова: полнотекстовый поиск, поисковые системы, релевантность, инвертированные файлы, поиск с учетом близости слов, индексы с трехкомпонентными ключами.

УДК: 519.683.5

MSC: 68P20, 68P10

Поступила в редакцию: 11.10.2020

DOI: 10.35634/vm210110



Реферативные базы данных:


© МИАН, 2024