2021 年 12月 3 日随笔档案 - CV技术指南（公众号）

2021年12月3日

摘要：前言本文回顾了ViT的结构，总结了计算机视觉中的transformer的主要改进思路：改进分块，改进位置编码，改进Encoder，增加Decoder。每个思路下都介绍了相关的论文，介绍了这些论文的提出出发点和改进思路。本文的目的不在于介绍transformer现在有哪些模型，而在于学习借鉴别阅读全文

posted @ 2021-12-03 18:38 CV技术指南（公众号）阅读(887) 评论(0) 推荐(0) 编辑

公告