RUS  ENG
Полная версия
ЖУРНАЛЫ // Вестник Астраханского государственного технического университета. Серия: Управление, вычислительная техника и информатика // Архив

Вестн. Астрахан. гос. техн. ун-та. Сер. управление, вычисл. техн. информ., 2012, номер 2, страницы 161–166 (Mi vagtu79)

УПРАВЛЕНИЕ В СОЦИАЛЬНЫХ И ЭКОНОМИЧЕСКИХ СИСТЕМАХ

Применение кластерного анализа для обработки документов в информационно-поисковой системе

И. А. Щербатов, И. О. Беляев

Астраханский государственный технический университет

Аннотация: Роль информационно-поисковых систем с каждым годом становится все более актуальной. Количество информации в электронном виде удваивается каждые 7–9 лет, поэтому решение задачи получения релевантной информации из большого объема данных становится ключевой при разработке любой информационно-поисковой системы. Описаны основные этапы построения информационно-поисковой системы. В качестве контента использовались новости с портала ria.ru за 2011 г. Описаны проблемы, возникающие при обработке большого объема данных, предложены механизмы по их решению. Качество поиска оценивается двумя ключевыми параметрами: точность и полнота. Немаловажным фактором информационно-поисковой системы является время отклика. Предложен механизм уменьшения времени отклика без потери качества поиска. Данный механизм основан на синтезе кластерного анализа и генетического алгоритма.

Ключевые слова: информационно-поисковая система, точность поиска, качество поиска, кластерный анализ, генетический алгоритм.

УДК: [002.6:004.65]:519.237.8
ББК: [73.72:32.988-5]:22.172.6

Поступила в редакцию: 28.06.2012



© МИАН, 2024