ListWise\PairWise\PointWise
概念:三种不同的排序模型学习(Learning to Rank)设计思路。主要体现在损失函数不同
用户 的查询query为 Q,候选文档集docs为 c1~CN,正确的结果排序假设为C1-CK 。候选文档集要一般大于最终返回的集合,因此N>K .例如,给出一个提问句子从候选句子(有10个)中选出最佳的5个的答案,返回的列表也要按优劣排序,优的在前面。
PointWise:把排序问题当成一个二分类问题。输入为q和c。输出为0~1表示c和q的匹配程度。1表示匹配。
缺陷:
该方法给出的是c对q的绝对打分。然而实际排序过程只需要有相对打分即可。(即A比B的相关性高即可)
没有充分利用样本间的结构性
query间doc的不平衡,如query1对应500个文档,query2对应10个文档。
Pairwise:学习的是两个候选样本之间的相对顺序。采用triplet loss形式的损失函数。要求正样本得分比负样本打分高于超参数阈值。
缺陷:
doc pair 的数量将是 doc 数量的二次,从而 pointwise 方法存在的 query 间 doc 数量的不平衡性将在 pairwise 类方法中进一步放大
pairwise 方法相对 pointwise 方法对噪声标注更敏感,即一个错误标注会引起多个 doc pair 标注错误。
pairwise 方法仅考虑了 doc pair 的相对位置,损失函数还是没有 model 到预测排序中的位置信息。(即整体顺序?这里有疑惑)
ListWise:优化的是整个候选列表中的排序信息。即给定k个文档。输入是K维度归一化向量。label是每个文档得分。训练目标是最小化二者KL散度。即去拟合label的位置信息分布。往往效果最好
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· 【自荐】一款简洁、开源的在线白板工具 Drawnix