Аннотация:
Рассматривается задача расчета матрицы ближайших соседей для полнотекстовых документов. Для характерных размеров потоков новостных документов (105 документов), коллекций правовых документов (106 документов) вычисление матрицы ближайших соседей требует значительных вычислительных ресурсов. В работе предложен алгоритм, который решает эту задачу за счет эффективной схемы расчета. Приводится сравнение с другими известными алгоритмами. Библиогр. 18 назв.
Ключевые слова:полнотекстовые документы, алгоритм полного попарного расчета матрицы ближайших соседей.