卷积神经网络的感受野(receptive field)
感受野 Receptive Field
卷积核输出的 feature map 特征图中某个节点对应其输入图像的区域大小即为该位置的感受野。
感受野相关的性质:
- 感受野越大,说明其接触的原始图像的范围越大,意味着其包含着更加全局、语义信息更丰富的特征;
- 感受野越小,说明其包含的特征更关注局部细节;
- 感受野不受padding的影响,sripe会影响下一层的感受野。
感受野大小的要求:
- 一般的任务要求感受野越大越好,如图像分类的最后卷积层输出特征图的感受野要大于输入图像
- 密集预测任务(如分割任务)要求输出像素的感受野足够大,即获得全局的信息以帮助分类决策
- 目标检测任务中设置anchor要严格对应感受野。anchor太大或者偏离感受野都会严重影响检测性能
感受野的计算
感受野的计算方法有自上而下和自下而上,目前看到的观点认为自下而上反推计算感受野比较靠谱,但两种方法算出的最终感受野一致,中间部分不同。
自上而下正推:
可按照如上公式进行计算,rn-1表示上一层的感受野大小,kn表示卷积核的大小,si为核的步长,步长影响的是下一层的感受野,
按照上述公式,VGG16的感受野计算为
(1 + (3 - 1) * 1 + (3 - 1) * 1 + (2 - 1) * 1 + (3 - 1) * 2 + (3 - 1) * 2 + .... ) = 212
3 → 5 → 6 → 10 → 14 → 16 → 24 → 32 → 40 → 44 → 60 → 76 → 92 → 100 → 132 → 164 → 196 → 212
自下而上反推:
VGG16的最后一层卷积层是池化层,尺寸大小为2,则最后一层的感受野为2,以2为开始进行推导
2 → 4 → 6 → 8→ 16 → 18 → 20 → 22 → 44 → 46 → 48 → 50 → 100 → 102 → 104 → 208 → 210 → 212
VGG16
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· AI 智能体引爆开源社区「GitHub 热点速览」
· 三行代码完成国际化适配,妙~啊~
· .NET Core 中如何实现缓存的预热?
2022-09-26 图像去雾
2022-09-26 图像特征提取