177 词嵌入除偏

这里的偏差不是我们之前所说的偏置,而是下面
image
以性别歧视为例,假设经过t-SNE可视化之后的图像是下面这个样子
image
除偏的步骤如下

  • 识别性别所代表的方向。我们在训练出来嵌入矩阵后,嵌入矩阵的每一行都是某个高维空间的一个坐标轴,我们使用SVD将这个高维空间中性别所代表的方向找出来
    image
    注意这里图中虽然性别这个方向是一维的,但实际上可能是高维的
  • 中立化。将不含性别意义(单词比如girl,boy,grandmother,grandfather等就是包含性别意义的)的词语消除性别偏差,也就是将他们投影到非性别方向上面,比如下图中babysiter和doctor进行的移动
    image
    但是有时不含性别意义的单词是比较难判别的,比如beard,只是说统计意义上男性的胡须更多,但是女性也有胡须。一般来说会训练一个二元分类器判断单词是否有性别意义
  • 均匀化。将含性别意义的词进行变换,使得每个词到非性别方向上的距离相等,于是这些词只有性别上的差异,如下
    image
    grandmother和grandfather被移动到了紫色点
    这样做是为了让不包含性别意义的词到包含性别意义的词的距离是相等的(比如图中babysiter到grandmother和grandfather的距离在移动前不等,在移动后就相等了),从而减少偏见
    注意变换是成对成对的,比如grandmother和grandfather到非性别方向的距离相等(设为d1),boy和girl到非性别方向的距离相等(设为d2),不一定有d1=d2
posted @   最爱丁珰  阅读(3)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗?
· 【译】Visual Studio 中新的强大生产力特性
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 【设计模式】告别冗长if-else语句:使用策略模式优化代码结构
历史上的今天:
2024-02-16 序列统计
2024-02-16 糖果盒
2024-02-16 何老板请客4
2024-02-16 何老板请客2
2024-02-16 何老板请客1
2024-02-16 体操队形1
2024-02-16 体操队形
点击右上角即可分享
微信分享提示