摘要: CaiT通过LayerScale层来保证深度ViT训练的稳定性,加上将特征学习和分类信息提取隔离的class-attention层达到了很不错的性能,值得看看 来源:晓飞的算法工程笔记 公众号 论文: Going deeper with Image Transformers 论文地址:https:/ 阅读全文
posted @ 2024-07-15 13:59 晓飞的算法工程笔记 阅读(83) 评论(0) 推荐(1) 编辑