RUS  ENG
Полная версия
ЖУРНАЛЫ // Вестник Санкт-Петербургского университета. Серия 10. Прикладная математика. Информатика. Процессы управления // Архив

Вестн. С.-Петербург. ун-та. Сер. 10. Прикл. матем. Информ. Проц. упр., 2019, том 15, выпуск 3, страницы 337–352 (Mi vspui412)

Эта публикация цитируется в 1 статье

Информатика

Application of webometrics methods for analysis and enhancement of academic site structure based on page value criterion

[Применение вебометрических методов анализа структуры сайта для улучшения его структуры по критерию ценности страниц]

A. M. Nwohiria, A. A. Pechnikovb

a University of Lagos, University Road, Akoka, Yaba, Lagos, 101017, Nigeria
b Institute of Applied Mathematical Research of the Karelian Research Centre, Russian Academy of Sciences, 11, Pushkinskaya ul., Petrozavodsk, 185910, Russian Federation

Аннотация: Описана формализованная процедура исследования веб-сайта вебометрическими методами, включающая сбор данных о его структуре, построение и исследование веб-графа сайта, определение критерия «правильности» структуры сайта, определение управляющих воздействий для улучшения структуры сайта в смысле заданного критерия, проверка критерия на реальных примерах и разработка рекомендаций по улучшению структуры сайта. В качестве критерия оценки значимости страниц используется их Web PageRank (PR). Ценность страницы определяется по наличию (или отсутствию) ссылки на нее на главной странице сайта. Страница считается «ценной», если такая ссылка имеется. Критерий «правильности» структуры сайта определяется так: ценные страницы сайта должны иметь наивысший PR среди всех страниц сайта (главная страница считается ценной по умолчанию). Как управляющее воздействие рассматривается удаление директорий (с выделением их в самостоятельные сайты), имеющих в качестве корня страницы с высоким PR, но не являющиеся ценными. Проведенные эксперименты демонстрируются на примере факультетских сайтов крупных университетов Нигерии, России и США и во всех случаях показывают свои применимость и состоятельность.

Ключевые слова: веб-сайт, график, PageRank, университеты, интеллектуальный анализ данных, структура веб-сайта, извлечение веб-данных, веб-майнинг, URL.

УДК: 004.738.5:51-7

MSC: 68R10

Поступила: 3 марта 2019 г.
Принята к печати: 6 июня 2019 г.

Язык публикации: английский

DOI: 10.21638/11701/spbu10.2019.304



Реферативные базы данных:


© МИАН, 2024