小卷积核的使用妙处/为什么用3乘3的卷积核
- 3个kernel3相当于1个kernel7的;
- 2个kernel3相当于1个kernel5的;
- 更深(特征更多 (局部最优)),非线性层越多(使决策函数更加具有辨别能力)
- 参数量减少3*(3C)的平方 vs (7C)的平方 计算量也减少
- 3×3的9个格子,最中间的格子是一个感受野中心,可以捕获上下左右以及斜对角的特征变化。(7x7,stride为4的话有好多地方信息重叠了)
参数量减少,可以更加steadily地增加层数得同时不会太过于担心计算量的暴增