Swin Transformer 1 计算机视觉

 

视频:

https://www.bilibili.com/video/BV1sA41157Fk/?spm_id_from=333.337.search-card.all.click&vd_source=6292df769fba3b00eb2ff1859b99d79e

https://www.bilibili.com/video/BV1U84y1G7R1/?vd_source=6292df769fba3b00eb2ff1859b99d79e

 

博文:

https://blog.csdn.net/weixin_45351699/article/details/126418013

https://blog.csdn.net/walkinginq/article/details/126406821

https://mp.weixin.qq.com/s?__biz=MzIwMTE1NjQxMQ==&mid=2247592890&idx=1&sn=4bf5d5864ee381b6cfb9abbc665cd362&chksm=96f119eea18690f864b39b392b887aa8fc1dc1de0dd09a9b7c6a4996844003c158aa04fc3374&scene=27

 

2021年,获得 ICCV 最佳论文奖的 Swin Transformer,通过在广泛的视觉问题上证明 Transformer 架构的有效性,加速了计算机视觉领域基本模型架构的变革。2021年末,微软亚洲研究院的研究员们又进一步提出了 Swin Transformer v2.0 版本,新版本训练了迄今为止最大的稠密视觉模型,并在多个主流视觉任务上大大刷新了记录,相关论文也已被 CVPR 2022 接收。研究员们希望借助 Swin Transformer v2.0 展现视觉大模型的“强悍”能力,呼吁整个领域加大对视觉大模型的投入,并为之提供相应的训练“配方”,从而为视觉领域的科研人员做进一步探索提供便利。

 

 

posted @ 2023-10-08 09:02  emanlee  阅读(21)  评论(0编辑  收藏  举报