会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
sunshine丶23
博客园
首页
新随笔
联系
订阅
管理
2022年11月21日
基于对比学习的文本相似度模型
摘要: 问题:BERT的表示本身存在塌缩的问题。通过对BERT词表示的观察,会发现整体呈锥形分布:高频词聚集在锥头部,低频词分散在锥尾。又由于高频词本身是高频的,因此会主要贡献整个的句子表示,让整体的相似度都很高。 解决思路: 对比学习,它是通过拉近相同样本的距离、拉远不同样本的距离,来刻画样本本身的表示,
阅读全文
posted @ 2022-11-21 16:01 sunshine丶23
阅读(419)
评论(0)
推荐(0)
编辑
公告