摘要: 前言 2D CNN 使用大卷积代替小卷积,增大了卷积核的感受野,捕获到的特征更偏向于全局,效果也得到了提升,这表明较大的 kernel size 很重要。但是,当直接在 3D CNN 中应用大卷积核时,那些在 2D 中成功的模块设计在 3D 网络效果不好,例如深度卷积。为了应对这一重要挑战,本文提出 阅读全文
posted @ 2023-04-12 12:22 CV技术指南(公众号) 阅读(229) 评论(0) 推荐(0) 编辑
摘要: 前言 美图影像研究院(MT Lab)与中国科学院大学突破性地提出正则化方法 DropKey,用于缓解 Vision Transformer 中的过拟合问题。该方法通过在注意力计算阶段随机 drop 部分 Key 以鼓励网络捕获目标对象的全局信息,从而避免了由过于聚焦局部信息所引发的模型偏置问题,继而 阅读全文
posted @ 2023-04-12 11:16 CV技术指南(公众号) 阅读(121) 评论(0) 推荐(0) 编辑