2023 年 4月 12 日随笔档案 - CV技术指南（公众号）

2023年4月12日

摘要：前言 2D CNN 使用大卷积代替小卷积，增大了卷积核的感受野，捕获到的特征更偏向于全局，效果也得到了提升，这表明较大的 kernel size 很重要。但是，当直接在 3D CNN 中应用大卷积核时，那些在 2D 中成功的模块设计在 3D 网络效果不好，例如深度卷积。为了应对这一重要挑战，本文提出阅读全文

posted @ 2023-04-12 12:22 CV技术指南（公众号）阅读(316) 评论(0) 推荐(0) 编辑

CVPR 2023｜两行代码高效缓解视觉Transformer过拟合，美图&国科大联合提出正则化方法DropKey

摘要：前言美图影像研究院（MT Lab）与中国科学院大学突破性地提出正则化方法 DropKey，用于缓解 Vision Transformer 中的过拟合问题。该方法通过在注意力计算阶段随机 drop 部分 Key 以鼓励网络捕获目标对象的全局信息，从而避免了由过于聚焦局部信息所引发的模型偏置问题，继而阅读全文

posted @ 2023-04-12 11:16 CV技术指南（公众号）阅读(143) 评论(0) 推荐(0) 编辑

公告