Я. А. Седова, И. Ю. Квятковская, “Интеллектуальный анализ корпуса документов научной информации”, Вестн. Астрахан. гос. техн. ун-та. Сер. управление, вычисл. техн. информ., 2011, номер 1,страницы 128

Эта публикация цитируется в 1 статье

КОМПЬЮТЕРНОЕ ОБЕСПЕЧЕНИЕ И ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА

Интеллектуальный анализ корпуса документов научной информации

Я. А. Седова, И. Ю. Квятковская

Астраханский государственный технический университет

Аннотация: Предлагаются: модифицированный алгоритм выделения из текста доминантных терминов; семантическая модель корпуса документов, позволяющая представить его в форме графа для последующего анализа; алгоритм синтеза корпуса документов с заданными признаками по результатам информационного поиска в глобальных сетях. Рассматривается подход к обработке авторефератов кандидатских и докторских диссертаций. Описан эксперимент по выявлению семантически похожих групп в корпусе документов. Библиогр. 8. Ил. 4.

Ключевые слова: интеллектуальный анализ текстовых данных, семантическая модель, онтология, латентный семантический анализ, кластерный анализ, информационно-поисковая система.

УДК: 004.912

Поступила в редакцию: 27.12.2010