RUS  ENG
Полная версия
ЖУРНАЛЫ // Вестник Астраханского государственного технического университета. Серия: Управление, вычислительная техника и информатика // Архив

Вестн. Астрахан. гос. техн. ун-та. Сер. управление, вычисл. техн. информ., 2009, номер 1, страницы 151–153 (Mi vagtu231)

СИСТЕМЫ ТЕЛЕКОММУНИКАЦИЙ

Фильтрация HTTP-трафика на основе анализа структуры web-страницы

А. П. Зайцев

Астраханский государственный технический университет

Аннотация: Повсеместное использование Интернет-сети в качестве источника информации и способа времяпрепровождения требует разработки надежного механизма фильтрации. Классификация web-страниц — один из самых сложных этапов фильтрации. Необходимо учитывать: HTML-структуру, содержательную часть и связь с другими ресурсами посредством гиперссылок. Особое внимание следует уделять метаинформации, которая должна отображать основные ключевые слова и краткое содержание web-страницы. Классификация web-страниц на основе метаинформации затруднена тем, что четкой границы между сообществами web-документов не существует. В данной ситуации имеет смысл использовать нейронечеткие классификаторы.
Библиогр. 1. Ил. 1.

Ключевые слова: web, HTML, HTTP, Интернет, фильтрация, структура, метаинформация.

УДК: 004.72

Поступила в редакцию: 22.12.2008



© МИАН, 2024