设:
图片输入大小为:W x W x D1
卷积核尺寸为: F x F
步长为: S
填充为:P
卷积核个数为:K
输出图片大小为:N x N x K
N = (W-F+2P)/ S +1
池化层的功能:
* 第一,又进行了一次特征提取,所以能减小下一层数据的处理量。
* 第二,能够获得更为抽象的信息,从而防止过拟合,也就是提高了一定的泛化性
* 第三,由于这种抽象性,所以能对输入的微小变化产生更大的容忍,也就是保持了它的不变性,这里的容忍包括图像的少量平移、旋转缩放等操作变化。
https://www.jianshu.com/p/eb4c2f06d93d
对于一个的原图像,通过填充(padding)个像素,经过一个步长是(stride)的(filter)的卷积核,最终特征图的尺寸为:
感性认识
总结
- 输入大小:
- 需要4个超参数:
- 卷积核个数
- 卷积核边长
- 步长
- 零填充的数量
- 输出大小:
- 参数共享,每一个卷积核有个权重参数,共有个权重参数和个偏差
- 通常设置为2的指数,如32,64,128,256,512