摘要: 题目:Training data-efficient image transformers & distillation through attention 【GiantPandaCV导语】Deit是一个全Transformer的架构,没有使用任何的卷及操作。其核心是将蒸馏方法引入VIT的训练,引入 阅读全文
posted @ 2021-09-24 10:19 pprp 阅读(1534) 评论(0) 推荐(0) 编辑