Аннотация:
Использование дифференциальной приватности (ДП) предполагает добавление контролируемого шума в исходные данные или результаты вычислений, что позволяет обеспечить надежное и доказуемое сохранение конфиденциальности, но способно заметно сказаться на статистических свойствах наборов данных, потенциально влияя на их последующий анализ. Такая особенность вынуждает искать баланс между приватностью и полезностью. Представлены результаты исследования влияния механизма Лапласа, обеспечивающего ДП, на различные распределения данных и их статистические свойства. В рамках трех экспериментов изучены особенности изменения ряда распределений при применении механизма Лапласа с различными значениями бюджета приватности (эпсилон), проведено сравнение классического механизма Лапласа с его расширениями в контексте их эффективности и рассмотрено влияние на различные уровни корреляции признаков в исходных данных. Результаты подчеркивают компромиссы между приватностью и полезностью данных, а также предоставляют рекомендации по выбору подходящих ДП-механизмов для различных сценариев.
Ключевые слова:
дифференциальная приватность, механизм Лапласа, информационная безопасность, математическая статистика, корреляция, конфиденциальность, сокрытие данных.
Поступила в редакцию: 27.12.2024 Принята в печать: 15.02.2025