差分隐私-问题和定义
问题模型及定义#
注意:密码学方法保证的是计算过程的隐私性,差分隐私保证的是计算结果的隐私性。
差分隐私的核心是保护个人数据的隐私,而不是保护群体数据的隐私。
差分隐私问题模型:一个受信任的数据监管方C拥有一组数据。该数据监管方的目标是给出一个随机算法描述数据子集D的某种指定信息,同时保证所有个体的隐私。
比如在企业薪资数据库中,表示员工i的薪资,则A(D)返回一个与员工集合D的平均工资相关的随机变量。
为了保护隐私,企业通常不会允许查询单个的用户信息,而是允许查询一个群体信息。但是,查询群体信息也存在泄漏隐私的风险,下面是严格的差分隐私的定义:
差分隐私:令为一个随机算法,其中为所有子集构成的集合,Y为A的值域。;令且相差一条数据不同(相邻数据集)。令。算法A满足差分隐私,当且仅当为相邻数据集并且所有的,以下不等式成立:
其中称为差分隐私算法的隐私预算
当很小时,令,则:
这表示在概率意义上近似相等。
性质:
- 越小,则隐私保护性越强
- 隐私保护和算法性能之间存在取舍;隐私保护性越强,算法的性能越弱。
变形差分隐私#
差分隐私:令随机算法A:, 令, 算法A满足差分隐私,当且仅当为相邻数据集和所有的,以下等式成立:
可以看出差分隐私是差分隐私变形的来的,其中是差分隐私的可能失效的概率。
局部差分隐私#
以上的两种差分隐私都涉及到一个数据管理第三方,但是在实际情况下很难找到这样的第三方。所以局部差分隐私出现了。每条数据作为独立的数据监管方对自己的数据独立地加入噪声以保护其隐私。
局部差分隐私:令随机算法A: , 令, 算法A满足局部差分隐私,当且仅当和, 以下不等式成立:
其中表示隐私数据添加噪声之后的数据。

作者:ALINGMAOMAO
出处:https://www.cnblogs.com/ALINGMAOMAO/p/17127002.html
版权:本作品采用「署名-非商业性使用-相同方式共享 4.0 国际」许可协议进行许可。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· 上周热点回顾(2.24-3.2)
2019-02-16 小a的轰炸游戏 (差分)
2019-02-16 水题:P2799 国王的魔镜