RUS  ENG
Полная версия
ЖУРНАЛЫ // Информатика и автоматизация // Архив

Тр. СПИИРАН, 2014, выпуск 33, страницы 24–47 (Mi trspy721)

Индексирование данных в пространстве большой размерности

Б. А. Новиковa, И. В. Судосb

a Санкт-Петербургский государственный университет, математико-механический факультет
b Санкт-Петербургский Государственный Университет

Аннотация: Индексирование данных является неотделимой частью задачи поиска. В то время как для данных в пространствах размерностей не более 5 существует хорошо изученный набор эффективных алгоритмов индексации и поиска, для пространств большой размерностей эти алгоритмы оказываются неэффективны или неприменимы. В этом обзоре мы приводим существующие обоснования проблем связанных с индексированием в пространствах большой размерности для задачи поиска ближайшего соседа. Рассматриваются возможные методы решения обозначенных проблем, применимые в областях анализа данных, таких как кластеризация и извлечение скрытых структур. Ставится вопрос о применимости различных методов размерностной редукции к задачи индексирования и поиска ближайшего соседа.

Ключевые слова: индексирование, поиск ближайшего соседа, данные большой размерности, анализ данных, редукция размерности.

УДК: 004.67



© МИАН, 2024