Gupta U., Ferber A. M., Dilkina B. and Steeg G. V. Controllable guarantees for fair outcomes via contrastive information estimation. AAAI, 2021.
概
本文提出了一种类似 Information Bottleneck 的方式用于保证两个群体的 fairness.
符合说明
-
D={xi,yi,ci}Ni=1, 其中 x,y,c 分别为 features, label 和 sensitive attributes.
-
我们用 x,y,c 来表示对应的随机变量.
-
z, 隐变量.
Motivation
-
假设我们考虑两个 group (c=0,c=1) 间的公平性, 一种常用的指标是:
ΔDP(A,c)=|P(^y=1|c=1)−P(^y=1|c=0)|.
-
但是上述指标是依赖算法 A 的, 我们更希望有一个指标, 优化它能够对所有的算法都是有效的, 作者通过如下的定理给出这样的一个指标.
-
Theorem 2. 对于 z,c∼p(z,c),z∈Rd,c∈{0,1}, 以及任意的算法 A, 我们有
I(z;c)≥g(π,ΔDP(A,c)),
其中 I(⋅;⋅) 表示互信息, π:=P(c=1), g 是一个单调递增的函数.
-
该定理, 给了一个很好的直觉: 倘若我们能够保证 I(z;c) 足够小, 那么 g(π,ΔDP(A,c)) 也足够小, 由于它是单调递增的, ΔDP(A,c) 也需要足够小.
-
于是, 一个对所有算法都有效的指标就是保证 I(z;c)≤δ.
优化目标
-
自然, 除了限制之外, 我们还希望 z,y 比较相关以利于后续的预测, 故我们的优化目标可以表述为:
maxq(z|x)I(y;z)s.t.I(z;c)≤δ.
或者采用如下的形式:
maxq(z|x)I(y;z)−βI(z;c).(1)
-
这一目标和普通的 information bottleneck 非常像

-
但是这个损失存在一些问题, 如上图所示 I(y;z) 表示阴影部分加上黑色斜线的部分, 而 I(z;c) 表示阴影加上黑点部分, 所以增加 I(y;z) 极容易同时增加 I(z;c).
-
实际上, 我们希望 z 称为画红线的区域, 这部分的互信息实际上是:
I(y;z|c)≤H(y|c),
故我们完全可以直接优化:
maxq(z|x)I(y;z|c)−βI(z;c).(2)
-
直接估计互信息是复杂的, 所以, 对于这类问题, 我们通常需要估计 I(y;z|c) 的一个下界, 以及 I(z;c) 的一个上界.
-
容易证明:
I(y;z|c)≥H(y|c)constant+maxrEy,z,clogr(y|z,c).(3)
-
I(z;c) 的上界首先注意到:
I(z;x,c)=I(z;x)+I(z;c|x)=I(z;c)+I(z;x|c),
又 z 仅与 x 有关, 故 I(z;c|x)=0, 故
I(z;c)=I(z;x)−I(z;x|c).(4)
(4) 是很有意思的, 它意味着, 最小化 I(z;c) 等价于最小化 I(z;x) (就像一般的 information bottleneck 一样), 同时最大化 I(z;x|c).
-
很自然地, 为了推导 (3) 的下界, 我们需要找出 I(z;x) 的上界和 I(z;x|c) 的下界.
-
根据 here 的 upper 可知
I(z;x)≤Ex{KL(q(z|x;ϕ),p(z))}.(5)
其中 p(z) 是先验分布, q(z|x;ϕ) 是用来拟合 z 的变分分布.
-
根据 here 的 Multi-sample unnormalized lower bounds 可知
I(z;x|c)≥Ez,x,clogef(z,x,c)1M∑Mj=1ef(~z,x,c),(6)
其中 ~z∼P(z|c), f 可以是任意的函数.
-
于是, 我们最终的损失是:
maxqI(y;z|c)(3)−β[I(z;x)(5)−λI(z;x|c)(6)],
这里额外的 λ 用于更好的平衡.
-
可以发现:
- (3) 实际上就是一般的交叉熵损失;
- (5) 如果假设 p(z)是高斯先验, 可以有显示的表达式;
- (6) 实际上是一个对比损失.
代码
official
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· Obsidian + DeepSeek:免费 AI 助力你的知识管理,让你的笔记飞起来!
· 分享4款.NET开源、免费、实用的商城系统
· 解决跨域问题的这6种方案,真香!
· 一套基于 Material Design 规范实现的 Blazor 和 Razor 通用组件库
· 5. Nginx 负载均衡配置案例(附有详细截图说明++)
2022-05-06 Distributionally Robust Neural Networks for Group Shifts: On the Importance of Regularization for Worst-Case Generalization
2019-05-06 A ROBUST KERNEL PCA ALGORITHM