И. О. Буянов, В. В. Ядринцев, И. В. Соченков, “Нейросетевые методы сжатия векторов для задачи приближенного поиска ближайших соседей”, Труды ИСП РАН, 2024, том 36, выпуск 1,страницы 7

Нейросетевые методы сжатия векторов для задачи приближенного поиска ближайших соседей

И. О. Буянов^a, В. В. Ядринцев^a, И. В. Соченков^abcd

^a Федеральный исследовательский центр «Информатика и управление» Российской академии наук
^b Институт системного программирования им. В.П. Иванникова РАН
^c Университет Иннополис
^d Первый Московский государственный медицинский университет им. И. М. Сеченова, Институт регенеративной медицины

Аннотация: В статье проверяется гипотеза применимости нейросетевых автокодировщиков как метод векторного сжатия для задачи приближенного поиска ближайших соседей. Проверка проводилась на нескольких больших датасетах с различными архитектурами автокодировщиков и индексов. Она показала, что, хотя ни одна из комбинаций автокодировщиков и индексов не может полностью превзойти чистые решения, в некоторых случаях они могут быть полезными. Мы также выявили некоторые эмпирические связи оптимальной размерности скрытого слоя и внутренней размерности наборов данных. Было также показано, что функция потерь является определяющим фактором качества сжатия.

Ключевые слова: приближенный поиск соседей, автокодировщики, крупномасштабный набор данных

DOI: 10.15514/ISPRAS-2024-36(1)-1