差分隐私-问题和定义

问题模型及定义#

注意:密码学方法保证的是计算过程的隐私性,差分隐私保证的是计算结果的隐私性。

差分隐私的核心是保护个人数据的隐私,而不是保护群体数据的隐私

差分隐私问题模型:一个受信任的数据监管方C拥有一组数据χ={X1,X2,..,Xn}。该数据监管方的目标是给出一个随机算法A(D)DX,A(D)描述数据子集D的某种指定信息,同时A(D)保证所有个体Xχ的隐私。

比如在企业薪资数据库中,Xi表示员工i的薪资,则A(D)返回一个与员工集合D的平均工资相关的随机变量。

为了保护隐私,企业通常不会允许查询单个的用户信息,而是允许查询一个群体信息。但是,查询群体信息也存在泄漏隐私的风险,下面是严格的差分隐私的定义:

ε差分隐私:令A:2χY为一个随机算法,其中2χχ所有子集构成的集合,Y为A的值域。;令D1,D2χ且相差一条数据不同(相邻数据集)。令ε>0。算法A满足ε差分隐私,当且仅当D1,D2χ为相邻数据集并且所有的yY,以下不等式成立:

Pr[A(D1)Y]Pr[A(D2)Y]exp(ε)

其中ε称为差分隐私算法的隐私预算

ε很小时,令1+ϵε,则:

1ϵPr[A(D1)Y]Pr[A(D2)Y]1+ϵ

这表示A(D1),A(D2)在概率意义上近似相等。

性质

  • ε越小,则隐私保护性越强
  • 隐私保护和算法性能之间存在取舍;隐私保护性越强,算法的性能越弱。

变形差分隐私#

(ε,δ)差分隐私:令随机算法A:2χY, 令δ,ε>0, 算法A满足(ε,δ)差分隐私,当且仅当D1,D2χ为相邻数据集和所有的yY,以下等式成立:

Pr[A(D1)Y]exp(ε)Pr[A(D2)Y]+δ

可以看出(ε,δ)差分隐私是ε差分隐私变形的来的,其中δε差分隐私的可能失效的概率。

image-20230216150644901

局部差分隐私#

以上的两种差分隐私都涉及到一个数据管理第三方,但是在实际情况下很难找到这样的第三方。所以局部差分隐私出现了。每条数据作为独立的数据监管方对自己的数据独立地加入噪声以保护其隐私。

(ε,δ)局部差分隐私:令随机算法A: 2χY, 令ε,δ>0, 算法A满足(ε,δ)局部差分隐私,当且仅当x,xχyY, 以下不等式成立:

Pr[A(x)Y]exp(ε)Pr[A(x)Y]+δ

其中x表示隐私数据x添加噪声之后的数据。

image-20230216152707420

作者:ALINGMAOMAO

出处:https://www.cnblogs.com/ALINGMAOMAO/p/17127002.html

版权:本作品采用「署名-非商业性使用-相同方式共享 4.0 国际」许可协议进行许可。

posted @   青山新雨  阅读(128)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· 上周热点回顾(2.24-3.2)
历史上的今天:
2019-02-16 小a的轰炸游戏 (差分)
2019-02-16 水题:P2799 国王的魔镜
more_horiz
keyboard_arrow_up light_mode palette
选择主题
menu
点击右上角即可分享
微信分享提示