RUS  ENG
Полная версия
ЖУРНАЛЫ // Вестник Санкт-Петербургского университета. Серия 10. Прикладная математика. Информатика. Процессы управления // Архив

Вестн. С.-Петербург. ун-та. Сер. 10. Прикл. матем. Информ. Проц. упр., 2011, выпуск 3, страницы 72–84 (Mi vspui48)

Информатика

Метод эффективного расчета матрицы ближайших соседей для полнотекстовых документов

М. С. Агеев, Б. В. Добров

Научно-исследовательский вычислительный центр Московского государственного университета имени М. В. Ломоносова

Аннотация: Рассматривается задача расчета матрицы ближайших соседей для полнотекстовых документов. Для характерных размеров потоков новостных документов (105 документов), коллекций правовых документов (106 документов) вычисление матрицы ближайших соседей требует значительных вычислительных ресурсов. В работе предложен алгоритм, который решает эту задачу за счет эффективной схемы расчета. Приводится сравнение с другими известными алгоритмами. Библиогр. 18 назв.

Ключевые слова: полнотекстовые документы, алгоритм полного попарного расчета матрицы ближайших соседей.

УДК: 519.61


Принята к печати: 10 марта 2011 г.



© МИАН, 2024