会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
Loading
脂环
博客园
首页
新随笔
联系
订阅
管理
2024年7月27日
ClearCLIP: Decomposing CLIP Representations for Dense Vision-Language Inference论文阅读笔记
摘要: Motivation & Abs 文章关注的任务为用VLM(如CLIP)做开放词汇分割,motivation主要来自于作者的一个观察:分割图中的噪声主要来自于残差连接,这会导致在文本-图像预训练更加强调全局特征,从而牺牲了局部判别能力,从而导致了分割结果中的噪声。为此作者提出了ClearCLIP,对
阅读全文
posted @ 2024-07-27 16:37 脂环
阅读(115)
评论(0)
推荐(0)
编辑
公告