05 2023 档案

摘要:** ## 摘要 本文提出了一个用于开放词汇语义分割的新框架SAN,将语义分割任务建模为区域识别问题,提取mask proposals并使用CLIP对mask进行识别。SAN可以重新利用CLIP的特征,因此其本身可以非常轻量;同时网络可以端到端地进行训练,从而使SAN适应冻结的CLIP模型。本文方法 阅读全文
posted @ 2023-05-29 20:30 脂环 阅读(940) 评论(0) 推荐(0) 编辑
摘要:1. https://developer.nvidia.com/cuda-toolkit-archive lsb_release查看ubuntu版本,选择对应版本后通过runfile安装: ``` wget https://developer.download.nvidia.com/compute/ 阅读全文
posted @ 2023-05-28 17:05 脂环 阅读(1032) 评论(0) 推荐(0) 编辑
摘要:## 摘要 作者提出了一种新的基于Transformer的目标检测模型DETR,将检测视为集合预测问题,无需进行nms以及anchor generation等操作。同时,对模型进行简单的修改就可以应用到全景分割任务中。 ## 方法 ### Object detection set predictio 阅读全文
posted @ 2023-05-26 22:26 脂环 阅读(184) 评论(0) 推荐(0) 编辑
摘要:这篇文章的arxiv版看着太折磨了,可以直接看openreview上作者修改后的版本https://openreview.net/forum?id=zWudXc9343以及rebuttal帮助理解。 ## 摘要 本文提出了一个新任务:开放词汇全景分割,同时作者给出了基于ViT CLIP骨干的base 阅读全文
posted @ 2023-05-23 17:16 脂环 阅读(373) 评论(0) 推荐(0) 编辑
摘要:## 摘要 作者提出了CLIP-S4,借助自监督像素表示学习和V-L模型实现各种语义分割任务,不需要使用任何像素级别标注以及未知类的信息。作者首先通过对图像的不同增强视角进行像素-分割对比学习来学习像素嵌入。之后,为进一步改善像素嵌入并实现基于自然语言的语义分割,作者设计了由V-L模型指导的嵌入一致 阅读全文
posted @ 2023-05-23 13:13 脂环 阅读(333) 评论(0) 推荐(0) 编辑
摘要:直接往tex文件中写入bibitem格式的参考文献难以满足按顺序引用文献的要求,参考https://zhuanlan.zhihu.com/p/468694034,可以使用GitHub的这个项目:https://github.com/LaTeX-Bibitem-Styler/latex-bibitem 阅读全文
posted @ 2023-05-09 11:02 脂环 阅读(1380) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示
主题色彩