Wang L. and Joachims T. Uncertainty quantification for fairness in two-stage recommender systems. In International World Wide Web Conference (WWW), 2023.
概
本文考虑召回阶段的 fairness. 作者希望通过分组的方式尽可能选取相关的 items.
符号说明
- [n]={1,2,…,n};
- dj∈D, item, j∈[n];
- d=(dj)j∈[n];
- q∈Q, query;
- rqj∈{0,1}, q 与 item dj 的 relevance;
- r=(rj)j∈[n];
- f:Q×D→[0,1], relevance model, 返回 q,d 的相关度的估计;
- πf:Q×Dn→{0,1}n, generation policy, 根据 q,d 得到 d 的选择方案 s=(sj)j∈[n],sj∈{0,1}. 其中 sj=1 表示 dj 被认为是与 q 相关的故选择.
主要内容
-
推荐系统通常先通过召回选择少量相关的 items, 然后再精排. 显然, 倘若召回得到的 items 本文与 query q 的相关度不够, 或者存在严重的不平衡问题, 就容易造成不可逆的性能或者公平性问题.
-
本文的策略是, 将所有的 items 分割成一些 groups G, 然后为每个 group g 设定一个值 kg. 在实际使用过程中, 我们通过 f 得到 g 中 items 和 query q 的相关度 rg, 然后选择 top-kg 作为候选. 本文的思想就是如何设计 kg.
-
首先假设, 每个 group 都有一个最优的 k∗g (但是我们并不知道), 我们用 kg 来估计.
-
令 σfq,g(j) 为 group g 中相关度排名为 j 的 item 的 index, 我们希望我们所选择的 top-kg 能够满足:
Ug(kg):=Eq,r[∑j∈[kg]rσfq,g(j)]≥U∗g:=Ug(k∗g).
即, top-kg 的方案在期望上是能够选择足够多的 ( > U∗g) 相关 items.
-
显然, 我们可以通过不断增大 kg 来满足这一条件, 但是这就失去了召回的意义. 我们自然希望 kg≈k∗g.
-
作者通过引入一些别的信息来估计 kg, 即假设
P(Ug(k)≥^U−g(k,α))≥1−α.
即假设我们能过找到这样一个映射 ^U−g, 它能够给出任意 size k 和置信度 1−α 下的下界 (该下界, 作者后面通过数据进行估计).
-
有了它, 我们就可以定义 kg:
^kuniong:=min{k∈[kmaxg−1]:^U−g(k,α(kmaxg−1))≥U∗g},^kmonog:=min{k∈[kmaxg−1]:^U−g(k′,α)≥U∗g,∀k≤k′<kmaxg.}
-
容易发现 (至少有 1−α 说实话, 很奇怪的证明, 感觉没啥意义):
Ug(^kuniong)≥^U−g(^kunion,α(kmaxg−1))≥U∗g,Ug(^kmonog)≥^U−g(^kmonog,α)≥U∗g.
-
最后利用 CIPW (clipped inverse propensity weighted) 来估计下界这里就不讲了.
代码
official
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
2021-03-29 Improved Variational Inference with Inverse Autoregressive Flow
2019-03-29 等式约束优化(可行点)