Аннотация:
Повсеместное использование Интернет-сети в качестве источника информации и способа времяпрепровождения требует разработки надежного механизма фильтрации. Классификация web-страниц — один из самых сложных этапов фильтрации. Необходимо учитывать: HTML-структуру, содержательную часть и связь с другими ресурсами посредством гиперссылок. Особое внимание следует уделять метаинформации, которая должна отображать основные ключевые слова и краткое содержание web-страницы. Классификация web-страниц на основе метаинформации затруднена тем, что четкой границы между сообществами web-документов не существует. В данной ситуации имеет смысл использовать нейронечеткие классификаторы.
Библиогр. 1. Ил. 1.