Аннотация:
Роль информационно-поисковых систем с каждым годом становится все более актуальной. Количество информации в электронном виде удваивается каждые 7–9 лет, поэтому решение задачи получения релевантной информации из большого объема данных становится ключевой при разработке любой информационно-поисковой системы. Описаны основные этапы построения информационно-поисковой системы. В качестве контента использовались новости с портала ria.ru за 2011 г. Описаны проблемы, возникающие при обработке большого объема данных, предложены механизмы по их решению. Качество поиска оценивается двумя ключевыми параметрами: точность и полнота. Немаловажным фактором информационно-поисковой системы является время отклика. Предложен механизм уменьшения времени отклика без потери качества поиска. Данный механизм основан на синтезе кластерного анализа и генетического алгоритма.