Schnabel T., Swaminathan A., Singh A., Chandak N., Joachims T. Recommendations as treatments: debiasing learning and evaluation. In International Conference on Machine Learning (ICML), 2016
概
由于一些未观测数据的存在, 一般的损失估计会存在 bias, 导致经此训练后的模型的表现不是很好. 本文提出用一种无偏的估计 (IPS) 来替代.
符号说明
- u∈{1,2,⋯,U}, user;
- i∈{1,2,⋯,I}, item;
- Y∈RU×I, true ratings;
- O∈{0,1}U×I, Ou,i=1 表示 Yu,i 是观测到的数据;
- Pu,i:=P(Ou,i=1);
MNAR 带来的 bias
通常, 我们希望最小化如下的损失来优化预测 ^Y:
R(^Y)=1UIU∑u=1I∑i=1δu,i(Y,^Y),(1)
这里 δu,i 可以是
MAE:δu,i(Y,^Y)=|Yu,i−^Yu,i|,MSE:δu,i(Y,^Y)=(Yu,i−^Yu,i)2,Accuracy:δu,i(Y,^Y)=I(Yu,i=^Yu,i).
但是, 因为部分数据 Yu,i 的缺失, 我们通常用如下的损失替代:
^Rnaive(^Y)=1|{(u,i):Ou,i=1}|∑(u,i):Ou,i=1δu,i(Y,^Y).(5)
但是 (5) 通常只有在 MCAR (Missing Completely At Random) Pu,i≡p 的 uniform 的情况 (且互相独立) 下才是 (1) 的无偏估计:
EO[^Rnaive(^Y)]=EO[1|{(u,i):Ou,i=1}|∑(u,i):Ou,i=1δu,i(Y,^Y)]=∑(u,i)δu,i(Y,^Y)EOu,i[1∑u,iOu,iOu,i]=EO[O∑u,iOu,i]∑(u,i)δu,i(Y,^Y)← [MCAR] Ou,i⊥⊥Ou′,i′+Pu,i≡p=1UI∑(u,i)δu,i(Y,^Y)←∑u,iEO[Ou,i∑u′,i′Ou′,i′]=1,EO[Ou,i∑u′,i′Ou′,i′]=EO[Ou,i∑u′,i′Ou′,i′].
而通常的 MNAR (Missing Not At Random) 情况, 上述的无偏性就失效了, 即
EO[^Rnaive(^Y)]≠R(^Y).
IPS Estimator
我们可以用如下的 Inverse-Propensity-Scoring (IPS) estimator 来替代 (5):
^RIPS(^Y|P)=1UI∑(u,i):Ou,i=1δu,i(Y,^Y)Pu,i,(10)
其中 |P 表示各 Pu,i 都是已知的, 当然这是比较理想的情况, 后面会给出更切实际的替代.
容易发现:
EO[^RIPS(^Y|P)]=1UI∑(u,i)EOu,i[δu,i(Y,^Y)Pu,iOu,i]=1UI∑(u,i)δu,i(Y,^Y)Pu,iEOu,i[Ou,i]=1UI∑(u,i)δu,i(Y,^Y)=R(^Y).
故 (10) 是一个无偏统计量.
IPS Estimator 的变化性
Proposition 3.1 (Tail Bound for IPS Estimator): 倘若 Ou,i 相互独立. 则给定任意的 ^Y,Y, 至少有 1−η 的概率保证
|^RIPS(^Y|P)−R(^Y)|≤1UI
⎷log2η2∑u,iρ2u,i,
其中 ρu,i=δu,i(Y,^Y)Pu,i 如果 Pu,i 否则 ρu,i=0.
proof:
令 Zu,i:=ρu,iOu,i, 则
P(|^RIPS(^Y|P)−R(^Y)|≥ϵ)=P(|∑u,i(Zu,i−E[Zu,i])|≥UIϵ)≤2exp(−2(UIϵ)2∑u,iρ2u,i)←Hoeffding's inequality.
只需令等式右端等于 η, 然后求解出 ϵ 即可.
当 Pu,i≡p 的时候, 上界大概是 O(1/p√UI) 级别的, 当 Pu,i 的分布严重不 uniform 的时候, 上界可能变得很大 (比如某个 Pu,i 特别小, 那么由于 Pu,i 作为分母, 会导致某个 ρu,i→∞). 所以, 可以说 IPS 用变化性交易了无偏性.
例子

- ML100K数据集, 其上的 Y 是全部可知的;
- 通过指定 Pu,i 使得观测到的量在 5% 左右;
- 构造不同的 ^Y:
- REC_ONES: ^Yu,i=Yu,i 除了在 {(u,i):Yu,i=1} 上, 随机将这些元素的打分设置为 ^Yu,i=5;
- REC_FOURS: 和上面的类似, 作用于 4 上;
- ROTATE: ^Yu,i=Yu,i−1, if Yu,i≥2, ^Yu,i=5, if Yu,i=1;
- SKEWED: ^Yu,i 从 N(⋅|μ=Yu,i,σ=6−Yu,i2) 中采样, 然后截断至 [0,6];
- COARSENED: ^Yu,i=3, if Yu,i≤3, 否则 ^Yu,i=4;
- 在这几种不同的情况下, 我们估计 MAE 所上图所示, 可以发现, IPS 比 Naive 要准确的多 (但是并不那么稳定).
注: 其它指标回看论文.
利用 IPS estimator 进行训练
令
^YERM=argmin^Y∈H{^RIPS(^Y|P)}(12)
为在空间 H 中的一个最优解.
泛化界
Theorem 4.2 (Propensity-Scored ERM Generalization Err Bound): 假设空间 H={^Y1,…,^Y|H|} 是有限的, 且 0≤δu,i(Y,^Y)≤Δ, Pu,i 是互相独立的. 此时至少有概率 1−η 能够保证
R(^YERM)≤^RIPS(^YERM|P)+ΔUI√log(2|H/η|)2√∑u,i1P2u,i.
proof:
P(|R(^YERM)−^RIPS(^YERM|P)|≤ϵ)≥P(max^Yi|R(^Yi)−^RIPS(^Yi|P)|≤ϵ)=P(⋁^Yi|R(^Yi)−^RIPS(^Yi|P)|≤ϵ)=1−P(⋀^Yi|R(^Yi)−^RIPS(^Yi|P)|≥ϵ)≥1−∑Hi=1P(|R(^Yi)−^RIPS(^Yi|P)|≥ϵ)≥1−|H|⋅2exp(−2ϵ2U2I2∑u,iΔ2P2u,i)← Proposition 3.1.
令最后的部分等于 1−η 然后求解出 ϵ 即可.
这意味着, 优化 (12) 实际上是在优化原先的一个上界.
例子
以 matrix factorization
^Yu,i=vTuwi+aui
为例, 此时需要优化
argminV,W,A[∑Ou,i=1δu,i(Y,VTW+A)Pu,i+λ(∥V∥2F+∥W∥2F)].
估计 Propensity Score
然而在实际中, Pu,i 通常是未知的, 此时我们需要估计 ^Pu,i. 容易发现
bias(^RIPS(^Y|^P)):=^R(^Y)−EO[^RIPS(^Y|^P)]=∑u,iδu,i(Y,^Y)UI[1−Pu,i^Pu,i]
即, 此时无偏性以及失去了.
泛化界
利用 ^RIPS(^Y|^P) 的泛化界为:
Theorem 5.2 (Propensity-Scored ERM Generalization Error Bound under Inaccurate Propensities): 假设空间 H={^Y1,…,^Y|H|} 是有限的, 且 0≤δu,i(Y,^Y)≤Δ, Pu,i 是互相独立的. 此时至少有概率 1−η 能够保证
R(^YERM)≤^RIPS(^YERM|^P)+ΔUI∑u,i|1−Pu,i^Pu,i|+ΔUI√log(2|H/η|)2
⎷∑u,i1^P2u,i.
proof:
只需注意到:
|R(^YERM)−^RIPS(^YERM|^P)|=|R(^YERM)−EO[R(^YERM|^P)]+EO[R(^YERM|^P)]−^RIPS(^YERM|^P)|≤|R(^YERM)−EO[R(^YERM|^P)]|+|EO[R(^YERM|^P)]−^RIPS(^YERM|^P)|≤ΔUI∑u,i|1−Pu,iPu,i|+|EO[R(^YERM|^P)]−^RIPS(^YERM|^P)|
而后者通过和定理 4.2 无二的证明方式即可.
上面的结论给出一个泛化界, 至于具体的估计方法, 作者给出了 Naive Bayes 和 Logistic Regression 两种方法.
疑问
需要注意的是, 一般的 Propensity Score e(X) 需要满足:
X⊥⊥Z|e(X),
其中
e(X):=P(Z|X).
在这里, 我们可以理解为
e(U,V)=P(O|U,V),
是一种实例级别的划分. 在实际情况中, 通常应该是
e(X)=P(O|X(U,V)),
即满足相同性质 X 的 U,V 服从相同的缺失率. 可以说文章中的两个估计方法就是依此准则来估计的, 而并非实例级别的估计.
代码
[official]
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· 【自荐】一款简洁、开源的在线白板工具 Drawnix