摘要: 22年初的屠榜模型 题目:用了移动窗口的层级式的vision transformer 摘要:Swin transformer可以作为CV中通用骨干网络。与NLP不同的第一个是对象尺度的问题,第二是多次提到的分辨率太大的问题,之前工作已经用很多办法减少过输入模型的序列长度。移动窗口可以让每次只计算一个 阅读全文
posted @ 2023-04-19 21:38 诸葛村夫CC 阅读(239) 评论(0) 推荐(0) 编辑
点击右上角即可分享
微信分享提示