Loading

摘要: Motivation & Abs 文章关注的任务为用VLM(如CLIP)做开放词汇分割,motivation主要来自于作者的一个观察:分割图中的噪声主要来自于残差连接,这会导致在文本-图像预训练更加强调全局特征,从而牺牲了局部判别能力,从而导致了分割结果中的噪声。为此作者提出了ClearCLIP,对 阅读全文
posted @ 2024-07-27 16:37 脂环 阅读(115) 评论(0) 推荐(0) 编辑