摘要: ​ 前言 本文回顾了ViT的结构,总结了计算机视觉中的transformer的主要改进思路:改进分块,改进位置编码,改进Encoder,增加Decoder。每个思路下都介绍了相关的论文,介绍了这些论文的提出出发点和改进思路。 本文的目的不在于介绍transformer现在有哪些模型,而在于学习借鉴别 阅读全文
posted @ 2021-12-03 18:38 CV技术指南(公众号) 阅读(807) 评论(0) 推荐(0) 编辑