RUS  ENG
Полная версия
ЖУРНАЛЫ // Записки научных семинаров ПОМИ // Архив

Зап. научн. сем. ПОМИ, 2024, том 540, страницы 46–60 (Mi znsl7543)

UnGAN: machine unlearning strategies through membership inference

[UnGAN: методы машинного разучивания через атаку на наличие в обучающей выборке]

A. Zhavoronkina, M. Pautovbc, N. Kalmykovd, E. Sevriugovd, D. Kovalevae, O. Y. Rogovdcf, I. Oseledetsdc

a Moscow Institute of Physics and Technology (National Research University)
b Ivannikov Institute for System Programming of the Russian Academy of Sciences
c Artificial Intelligence Research Institute
d Skolkovo Institute of Science and Technology
e SaluteDevices
f VeinCV LLC

Аннотация: В условиях растущих требований к конфиденциальности данных и праву на забвение, способность эффективно исключать определенные данные из моделей машинного обучения без повторного обучения с нуля становится решающей. Машинное разучивание направлено на эффективное устранение влияния некоторых данных на модель. Мы предлагаем UnGAN, новый подход к машинному разучиванию, использующий генеративно-состязательные сети (GAN) для удовлетворения растущей потребности в эффективном и надежном удалении данных из обученных моделей. UnGAN предлагает уникальную стратегию разучивания через атаку на наличие в обучающей выборке, где дискриминаторная сеть обучается определять, был ли данный ввод частью набора данных для обучения модели. Дискриминатор представляет собой трехслойную полностью соединённую сеть с функциями активации ReLU, принимающую входы от вывода модели, подвергающейся разучиванию, и метку класса. Эта архитектура позволяет дискриминатору с высокой точностью определять статус членства данных, что позволяет управлять процессом разучивания. Библ. – 35 назв.

Ключевые слова: забывание в моделях машинного обучения, порождающие состязательные сети, глубокое обучение, доверенный ИИ.

Поступило: 15.11.2024

Язык публикации: английский



© МИАН, 2025