摘要: 在长尾数据集上,本文引入强增强(文中也称为OOD)实现对DeiT的知识蒸馏的改进,实现尾部类分类性能的提升。 动机 ViT相较于CNN缺少归纳偏置,如局部性(一个像素与周围的区域关系更紧密)、平移不变性(图像的主体在图像的任意位置都应该一样重要)。因此需要大型数据集进行预训练。 长尾数据学习的工作有 阅读全文
posted @ 2024-09-22 20:48 October- 阅读(97) 评论(0) 推荐(0) 编辑