2024 年 7月 10 日随笔档案 - 晓飞的算法工程笔记

2024年7月10日

CvT：微软提出结合CNN的ViT架构 | 2021 arxiv

摘要： CvT将Transformer与CNN在图像识别任务中的优势相结合，从CNN中借鉴了多阶段的层级结构设计，同时引入了Convolutional Token Embedding和Convolutional Projection操作增强局部建模能力，在保持计算效率的同时实现了卓越的性能。此外，由于卷积的阅读全文

posted @ 2024-07-10 12:24 晓飞的算法工程笔记阅读(295) 评论(0) 推荐(0) 编辑

晓飞的算法工程笔记

公告