05 2023 档案
摘要:** ## 摘要 本文提出了一个用于开放词汇语义分割的新框架SAN,将语义分割任务建模为区域识别问题,提取mask proposals并使用CLIP对mask进行识别。SAN可以重新利用CLIP的特征,因此其本身可以非常轻量;同时网络可以端到端地进行训练,从而使SAN适应冻结的CLIP模型。本文方法
阅读全文
摘要:1. https://developer.nvidia.com/cuda-toolkit-archive lsb_release查看ubuntu版本,选择对应版本后通过runfile安装: ``` wget https://developer.download.nvidia.com/compute/
阅读全文
摘要:## 摘要 作者提出了一种新的基于Transformer的目标检测模型DETR,将检测视为集合预测问题,无需进行nms以及anchor generation等操作。同时,对模型进行简单的修改就可以应用到全景分割任务中。 ## 方法 ### Object detection set predictio
阅读全文
摘要:这篇文章的arxiv版看着太折磨了,可以直接看openreview上作者修改后的版本https://openreview.net/forum?id=zWudXc9343以及rebuttal帮助理解。 ## 摘要 本文提出了一个新任务:开放词汇全景分割,同时作者给出了基于ViT CLIP骨干的base
阅读全文
摘要:## 摘要 作者提出了CLIP-S4,借助自监督像素表示学习和V-L模型实现各种语义分割任务,不需要使用任何像素级别标注以及未知类的信息。作者首先通过对图像的不同增强视角进行像素-分割对比学习来学习像素嵌入。之后,为进一步改善像素嵌入并实现基于自然语言的语义分割,作者设计了由V-L模型指导的嵌入一致
阅读全文
摘要:直接往tex文件中写入bibitem格式的参考文献难以满足按顺序引用文献的要求,参考https://zhuanlan.zhihu.com/p/468694034,可以使用GitHub的这个项目:https://github.com/LaTeX-Bibitem-Styler/latex-bibitem
阅读全文