2023 年 5月随笔档案 - 脂环

[CVPR23 Highlight] Side Adapter Network for Open-Vocabulary Semantic Segmentation论文阅读笔记

摘要：** ## 摘要本文提出了一个用于开放词汇语义分割的新框架SAN，将语义分割任务建模为区域识别问题，提取mask proposals并使用CLIP对mask进行识别。SAN可以重新利用CLIP的特征，因此其本身可以非常轻量；同时网络可以端到端地进行训练，从而使SAN适应冻结的CLIP模型。本文方法阅读全文

posted @ 2023-05-29 20:30 脂环阅读(940) 评论(0) 推荐(0) 编辑

linux安装cuda11.3 多版本切换

摘要：1. https://developer.nvidia.com/cuda-toolkit-archive lsb_release查看ubuntu版本，选择对应版本后通过runfile安装： ``` wget https://developer.download.nvidia.com/compute/ 阅读全文

posted @ 2023-05-28 17:05 脂环阅读(1032) 评论(0) 推荐(0) 编辑

End-to-End Object Detection with Transformers论文阅读笔记

摘要：## 摘要作者提出了一种新的基于Transformer的目标检测模型DETR，将检测视为集合预测问题，无需进行nms以及anchor generation等操作。同时，对模型进行简单的修改就可以应用到全景分割任务中。 ## 方法 ### Object detection set predictio 阅读全文

posted @ 2023-05-26 22:26 脂环阅读(184) 评论(0) 推荐(0) 编辑

Open-Vocabulary Panoptic Segmentation with MaskCLIP论文阅读笔记

摘要：这篇文章的arxiv版看着太折磨了，可以直接看openreview上作者修改后的版本https://openreview.net/forum?id=zWudXc9343以及rebuttal帮助理解。 ## 摘要本文提出了一个新任务：开放词汇全景分割，同时作者给出了基于ViT CLIP骨干的base 阅读全文

posted @ 2023-05-23 17:16 脂环阅读(373) 评论(0) 推荐(0) 编辑

CLIP-S^4：Language-Guided Self-Supervised Semantic Segmentation论文阅读笔记

摘要：## 摘要作者提出了CLIP-S4，借助自监督像素表示学习和V-L模型实现各种语义分割任务，不需要使用任何像素级别标注以及未知类的信息。作者首先通过对图像的不同增强视角进行像素-分割对比学习来学习像素嵌入。之后，为进一步改善像素嵌入并实现基于自然语言的语义分割，作者设计了由V-L模型指导的嵌入一致阅读全文

posted @ 2023-05-23 13:13 脂环阅读(333) 评论(0) 推荐(0) 编辑

使用LaTeX的bibitems引用时按照引用顺序对文献进行编号

摘要：直接往tex文件中写入bibitem格式的参考文献难以满足按顺序引用文献的要求，参考https://zhuanlan.zhihu.com/p/468694034，可以使用GitHub的这个项目：https://github.com/LaTeX-Bibitem-Styler/latex-bibitem 阅读全文

posted @ 2023-05-09 11:02 脂环阅读(1380) 评论(0) 推荐(0) 编辑

Loading

脂环

05 2023 档案

公告

搜索

常用链接

积分与排名

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论