Swin Transformer 1 计算机视觉

视频：

https://www.bilibili.com/video/BV1sA41157Fk/?spm_id_from=333.337.search-card.all.click&vd_source=6292df769fba3b00eb2ff1859b99d79e

https://www.bilibili.com/video/BV1U84y1G7R1/?vd_source=6292df769fba3b00eb2ff1859b99d79e

博文：

https://blog.csdn.net/weixin_45351699/article/details/126418013

https://blog.csdn.net/walkinginq/article/details/126406821

https://mp.weixin.qq.com/s?__biz=MzIwMTE1NjQxMQ==&mid=2247592890&idx=1&sn=4bf5d5864ee381b6cfb9abbc665cd362&chksm=96f119eea18690f864b39b392b887aa8fc1dc1de0dd09a9b7c6a4996844003c158aa04fc3374&scene=27

2021年，获得 ICCV 最佳论文奖的 Swin Transformer，通过在广泛的视觉问题上证明 Transformer 架构的有效性，加速了计算机视觉领域基本模型架构的变革。2021年末，微软亚洲研究院的研究员们又进一步提出了 Swin Transformer v2.0 版本，新版本训练了迄今为止最大的稠密视觉模型，并在多个主流视觉任务上大大刷新了记录，相关论文也已被 CVPR 2022 接收。研究员们希望借助 Swin Transformer v2.0 展现视觉大模型的“强悍”能力，呼吁整个领域加大对视觉大模型的投入，并为之提供相应的训练“配方”，从而为视觉领域的科研人员做进一步探索提供便利。

posted @ 2023-10-08 09:02 emanlee 阅读(21) 评论(0) 编辑收藏举报

刷新页面返回顶部