RUS  ENG
Полная версия
ЖУРНАЛЫ // Вестник Южно-Уральского государственного университета. Серия «Вычислительная математика и информатика» // Архив

Вестн. ЮУрГУ. Сер. Выч. матем. информ., 2022, том 11, выпуск 4, страницы 51–66 (Mi vyurv287)

Developing intelligent assistants to searchfor content on websites of a certain genre

[Разработка интеллектуальных помощников для поиска по контенту веб-сайта определенного жанра]

V. D. Rublev, E. A. Sidorova

A.P. Ershov Institute of Informatics Systems, Siberian Branch of the Russian Academy of Sciences (Lavrentieva Avenue 6, Novosibirsk, 630090 Russia)

Аннотация: В данной работе предлагается подход к созданию интеллектуальных помощников в виде чат-ботов, поддерживающих информационный поиск на основе модели намерений пользователя, предварительной жанровой и тематической кластеризации контента веб-сайта. Особенностью подхода является использование жанровых моделей, разрабатываемых для заданного типа ресурса (образовательный, информационный и т.п.), на основе которых осуществляется жанровая структуризация контента конкретного сайта. Полученные жанровые структуры позволяют более точно определять границы тематических кластеров, относящиеся к теме поискового запроса пользователя. Оценка качества поиска по сайту НГУ показала F-меру 87.8% и оригинальность 80.9%, что превосходит результаты поисковой системы Яндекс на 1.1% и 9.1% соответственно. С целью повышения качества информационной поддержки пользователя разработана модель поисковых намерений пользователя, которая позволяет неявно получить информацию о том, что пользователя не устроило в поисковой выдаче и уточнить новый поисковый запрос. В практической части работы реализован чат-бот на платформе мессенджера Telegram для информационного поиска по сайтам образовательных организаций. Проведенные эксперименты показали, что пользователю в среднем требуется 1.75 уточняющих вопросов для нахождения необходимой информации.

Ключевые слова: поисковая система, интеллектуальный помощник, жанровая модель веб-сайта, тематический анализ, модель поисковых намерений пользователя.

УДК: 004.912

Поступила в редакцию: 06.11.2022

Язык публикации: английский

DOI: 10.14529/cmse220404



© МИАН, 2024