Uncertainty Quantification for Fairness in Two-Stage Recommender Systems

Wang L. and Joachims T. Uncertainty quantification for fairness in two-stage recommender systems. In International World Wide Web Conference (WWW), 2023.

本文考虑召回阶段的 fairness. 作者希望通过分组的方式尽可能选取相关的 items.

符号说明

  • [n]={1,2,,n};
  • djD, item, j[n];
  • d=(dj)j[n];
  • qQ, query;
  • rjq{0,1}, q 与 item dj 的 relevance;
  • r=(rj)j[n];
  • f:Q×D[0,1], relevance model, 返回 q,d 的相关度的估计;
  • πf:Q×Dn{0,1}n, generation policy, 根据 q,d 得到 d 的选择方案 s=(sj)j[n],sj{0,1}. 其中 sj=1 表示 dj 被认为是与 q 相关的故选择.

主要内容

  • 推荐系统通常先通过召回选择少量相关的 items, 然后再精排. 显然, 倘若召回得到的 items 本文与 query q 的相关度不够, 或者存在严重的不平衡问题, 就容易造成不可逆的性能或者公平性问题.

  • 本文的策略是, 将所有的 items 分割成一些 groups G, 然后为每个 group g 设定一个值 kg. 在实际使用过程中, 我们通过 f 得到 g 中 items 和 query q 的相关度 rg, 然后选择 top-kg 作为候选. 本文的思想就是如何设计 kg.

  • 首先假设, 每个 group 都有一个最优的 kg (但是我们并不知道), 我们用 kg 来估计.

  • σq,gf(j) 为 group g 中相关度排名为 j 的 item 的 index, 我们希望我们所选择的 top-kg 能够满足:

    Ug(kg):=Eq,r[j[kg]rσq,gf(j)]Ug:=Ug(kg).

    即, top-kg 的方案在期望上是能够选择足够多的 ( > Ug) 相关 items.

  • 显然, 我们可以通过不断增大 kg 来满足这一条件, 但是这就失去了召回的意义. 我们自然希望 kgkg.

  • 作者通过引入一些别的信息来估计 kg, 即假设

    P(Ug(k)U^g(k,α))1α.

    即假设我们能过找到这样一个映射 U^g, 它能够给出任意 size k 和置信度 1α 下的下界 (该下界, 作者后面通过数据进行估计).

  • 有了它, 我们就可以定义 kg:

    k^gunion:=min{k[kgmax1]:U^g(k,α(kgmax1))Ug},k^gmono:=min{k[kgmax1]:U^g(k,α)Ug,kk<kgmax.}

  • 容易发现 (至少有 1α 说实话, 很奇怪的证明, 感觉没啥意义):

    Ug(k^gunion)U^g(k^union,α(kgmax1))Ug,Ug(k^gmono)U^g(k^gmono,α)Ug.

  • 最后利用 CIPW (clipped inverse propensity weighted) 来估计下界这里就不讲了.

代码

official

posted @   馒头and花卷  阅读(63)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
历史上的今天:
2021-03-29 Improved Variational Inference with Inverse Autoregressive Flow
2019-03-29 等式约束优化(可行点)
点击右上角即可分享
微信分享提示