RUS  ENG
Полная версия
ЖУРНАЛЫ // Труды института системного программирования РАН // Архив

Труды ИСП РАН, 2025, том 37, выпуск 5, страницы 33–42 (Mi tisp1039)

Применение суффиксных кодов в модульной метрике для решения задачи кластеризации и задачи поиска k-соседей

А. Р. Шарапов, В. А. Давыдов

Национальный исследовательский университет "Высшая школа экономики"

Аннотация: Данная работа посвящена применению суффиксных кодов в модульной метрике для решения задач кластеризации и поиска ближайших соседей (k-nearest neighbors, kNN). Рассматриваются преимущества использования модульной метрики перед евклидовой метрикой, особенно в пространствах высокой размерности. Основной акцент сделан на разработку эффективных алгоритмов кластеризации и поиска ближайших соседей с использованием кодов, позволяющих исправить ошибки в модульной метрике. Предложенный подход обеспечивает полиномиальную сложность относительно размерности обучающей выборки, что делает его перспективным для приложений машинного обучения с большими наборами данных и высокими требованиями к производительности.

Ключевые слова: метод k-ближайших соседей, метрики, кластеризация, коды в модульной метрике, вектор.

DOI: 10.15514/ISPRAS-2025-37(5)-2



© МИАН, 2025