RUS  ENG
Полная версия
ЖУРНАЛЫ // Информационные технологии и вычислительные системы // Архив

ИТиВС, 2013, выпуск 1, страницы 33–42 (Mi itvs105)

МЕТОДЫ ОБРАБОТКИ ИНФОРМАЦИИ

Метод тематической кластеризации масштабных коллекций научно-технических документов

Д. А. Девяткинab, Р. Е. Суворовab, И. В. Соченковba

a ООО "Технологии системного анализа"
b ИСА РАН

Аннотация: В статье представлены результаты исследования в области методов тематической кластеризации научно-технических документов. Сформулированы требования к реализации методов кластеризации масштабных коллекций документов в поисково-аналитических системах. Предложен метод и разработан алгоритм тематической кластеризации масштабных коллекций научно-технических документов в поисково-аналитической системе. Выполнено экспериментальное сравнение результатов работы предложенного метода с несколькими классическими методами кластеризации текстов.

Ключевые слова: кластеризация, классификация, дескриптор, спектральный индекс, тематическая значимость.



© МИАН, 2024