Аннотация:
Работа посвящена исследованию методов защиты статистических баз данных с количественными свойствами сущностей. Рассматриваются два основных подхода к обеспечению конфиденциальности данных: метод добавления шума и метод ограничения запросов. На основе анализа рисков утечки информации при статистических вычислениях, таких как сумма, среднее и максимум, разработана математическая модель, описывающая угрозу выделения записи из набора данных с помощью предиката.
Показано, что механизмы, обеспечивающие дифференциальную конфиденциальность, эффективно защищают данные от идентификации, сохраняя полезность информации. Также анализируется применимость метода ограничения запросов, выявляются его ограничения и предлагается альтернативный фреймворк для оценки безопасности различных статистических метрик.
Практическая часть работы включает описание внедрения предложенной модели в программно-аппаратный комплекс «Анклав», предназначенный для безопасной обработки данных и обучения моделей машинного обучения. Рассмотрены основные этапы жизненного цикла данных и процессы подготовки, обработки и валидации в рамках защищённой среды.
Результаты работы могут быть использованы при разработке систем защищённой аналитики и машинного обучения на конфиденциальных данных.
Website:
https://us02web.zoom.us/j/81866745751?pwd=bEFqUUlZM1hVV0tvN0xWdXRsV2pnQT09
|