RUS  ENG
Полная версия
ЖУРНАЛЫ // Труды института системного программирования РАН // Архив

Труды ИСП РАН, 2024, том 36, выпуск 1, страницы 7–22 (Mi tisp852)

Нейросетевые методы сжатия векторов для задачи приближенного поиска ближайших соседей

И. О. Буяновa, В. В. Ядринцевa, И. В. Соченковabcd

a Федеральный исследовательский центр «Информатика и управление» Российской академии наук
b Институт системного программирования им. В.П. Иванникова РАН
c Университет Иннополис
d Первый Московский государственный медицинский университет им. И. М. Сеченова, Институт регенеративной медицины

Аннотация: В статье проверяется гипотеза применимости нейросетевых автокодировщиков как метод векторного сжатия для задачи приближенного поиска ближайших соседей. Проверка проводилась на нескольких больших датасетах с различными архитектурами автокодировщиков и индексов. Она показала, что, хотя ни одна из комбинаций автокодировщиков и индексов не может полностью превзойти чистые решения, в некоторых случаях они могут быть полезными. Мы также выявили некоторые эмпирические связи оптимальной размерности скрытого слоя и внутренней размерности наборов данных. Было также показано, что функция потерь является определяющим фактором качества сжатия.

Ключевые слова: приближенный поиск соседей, автокодировщики, крупномасштабный набор данных

DOI: 10.15514/ISPRAS-2024-36(1)-1



© МИАН, 2024