05 2024 档案

摘要:论文提出CeiT混合网络,结合了CNN在提取低维特征方面的局部性优势以及Transformer在建立长距离依赖关系方面的优势。CeiT在ImageNet和各种下游任务中达到了SOTA,收敛速度更快,而且不需要大量的预训练数据和额外的CNN蒸馏监督,值得借鉴 来源:晓飞的算法工程笔记 公众号 论文: 阅读全文
posted @ 2024-05-23 13:17 晓飞的算法工程笔记 阅读(322) 评论(0) 推荐(0) 编辑
摘要:论文设计了用于密集预测任务的纯Transformer主干网络PVT,包含渐进收缩的特征金字塔结构和spatial-reduction attention层,能够在有限的计算资源和内存资源下获得高分辨率和多尺度的特征图。从物体检测和语义分割的实验可以看到,PVT在相同的参数数量下比CNN主干网络更强大 阅读全文
posted @ 2024-05-22 13:31 晓飞的算法工程笔记 阅读(439) 评论(0) 推荐(1) 编辑
摘要:论文提出了T2T-ViT模型,引入tokens-to-token(T2T)模块有效地融合图像的结构信息,同时借鉴CNN结果设计了deep-narrow的ViT主干网络,增强特征的丰富性。在ImageNet上从零训练时,T2T-ViT取得了优于ResNets的性能MobileNets性能相当 来源:晓 阅读全文
posted @ 2024-05-20 12:30 晓飞的算法工程笔记 阅读(220) 评论(0) 推荐(0) 编辑