脂环 - 博客园

2023年2月24日

摘要： terminal输入： defaults write com.apple.dock desktop-picture-show-debug-text -bool True;killall Dock 壁纸路径就会显示在桌面了：如果记下路径后将上面命令的布尔值改成False就可以恢复原状： defaul 阅读全文

posted @ 2023-02-24 17:51 脂环阅读(344) 评论(0) 推荐(0) 编辑

2023年2月22日

CLIP is Also an Efficient Segmenter: A Text-Driven Approach for Weakly Supervised Semantic Segmentation论文阅读笔记

摘要：摘要文章提出了一种利用CLIP模型进行弱监督语义分割的新方法，称为CLIP-ES，它能够在不需要额外训练的情况下，仅使用图像级标签就能生成高质量的分割掩码。它通过对CLIP进行特殊设计来改进WSSS的三个阶段： 1）将softmax函数引入GradCAM，并利用CLIP的zero-shot能力抑制阅读全文

posted @ 2023-02-22 16:50 脂环阅读(668) 评论(0) 推荐(0) 编辑

自然语言处理之Prompt Ensembling

摘要： Prompt ensembling是指将多个不同的提示（prompts）应用于同一个模型，从而提高模型的性能和鲁棒性。提示是一种用于指导模型生成预测的文本片段，通常是问题或任务描述。在Prompt ensembling中，不同的提示被组合在一起，以产生一个更强大和全面的模型。 Prompt ense 阅读全文

posted @ 2023-02-22 09:01 脂环阅读(516) 评论(0) 推荐(1) 编辑

2023年2月17日

CLIP-TD: CLIP Targeted Distillation for Vision-Language Tasks论文阅读笔记

摘要： CLIP-TD: CLIP Targeted Distillation for Vision-Language Tasks论文阅读笔记摘要这是一篇关于利用CLIP模型来提升视觉语言任务性能的论文。CLIP模型是一个可以从大量图片和文字数据中学习通用视觉语言表示的模型，它有很强的零样本和少样本学习阅读全文

posted @ 2023-02-17 15:38 脂环阅读(361) 评论(0) 推荐(0) 编辑

2023年2月11日

CVPR2021 PLOP 论文+CLIP代码环境搭建

摘要：查看cuda版本（10.1）: ```bash nvcc -V ``` 创建python3.7虚拟环境： ```bash conda install pytorch==1.8.0 torchvision==0.9.0 torchaudio==0.8.0 cudatoolkit=10.1 -c pyt 阅读全文

posted @ 2023-02-11 13:55 脂环阅读(288) 评论(0) 推荐(0) 编辑

2023年2月7日

Decoupling Zero-Shot Semantic Segmentation论文阅读笔记

摘要：摘要现有的方法将零样本语义分割（Zero-shot semantic segmentation，ZS3）视为逐像素的zs分类，并且使用仅用文本预训练的模型来完成已知类到未知类的知识迁移，而文本图像预训练模型对于视觉任务有更大的潜力。同时，人类通常进行的是区域级的语义标注，因此，作者提出了一种新的范阅读全文

posted @ 2023-02-07 21:38 脂环阅读(139) 评论(0) 推荐(0) 编辑

2023年2月6日

MaskFormer代码理解

摘要： MaskFormer代码理解模型主体代码全部放在/mask_former下面。进入到这个路径，首先发现有一个mask_former_model.py，打开可以发现这就是论文提出的MaskFormer主类所在的文件。先看forward函数的前面五行： def forward(self, batch 阅读全文

posted @ 2023-02-06 22:59 脂环阅读(1203) 评论(0) 推荐(0) 编辑

CoMFormer: Continual Learning in Semantic and Panoptic Segmentation论文阅读笔记

摘要：摘要文章的贡献是借助MaskFormer设计了CoMFormer，从而完成对全景分割的连续学习，提出了基于mask的伪标签以对抗遗忘。方法基于MaskFormer，作者将分割视为对mask的分类。输出的形式等都与MaskFormer相同，模型结构也与MaskFormer基本一致。对于每一个st 阅读全文

posted @ 2023-02-06 22:57 脂环阅读(203) 评论(0) 推荐(0) 编辑

2023年2月2日

Per-Pixel Classification is Not All You Need for Semantic Segmentation论文阅读笔记

摘要：作者的解读：https://www.zhihu.com/search?type=content&q=MaskFormer 摘要现有的语义分割方法将分割视为逐像素的分类，本文提出了MaskFormer，把分割转化为预测一系列的mask以及为这些mask预测一个global类别，这样可以很方便地将语义阅读全文

posted @ 2023-02-02 00:59 脂环阅读(357) 评论(0) 推荐(0) 编辑

2023年1月29日

Learning to Prompt for Continual Learning论文阅读笔记

摘要：摘要本文的主要贡献是提出了一种连续学习的方法L2P，可以自动学习提示（Prompt）一个预训练的模型，从而能够在学习一系列的任务的同时减轻灾难性遗忘，并且这个过程无需使用记忆回放等方法。本文的方法中提示是小的可学习的参数，最终目的是优化提示从而在保证可塑性的同时指导模型的预测以及明确地管理任务变量阅读全文

posted @ 2023-01-29 21:34 脂环阅读(714) 评论(0) 推荐(0) 编辑

Loading

脂环

公告

搜索

常用链接

积分与排名

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论