设:

图片输入大小为:W x W x D1

卷积核尺寸为: F x F

步长为: S

填充为:P

卷积核个数为:K

输出图片大小为:N x N x K

        N = (W-F+2P)/ S   +1

池化层的功能:
* 第一,又进行了一次特征提取,所以能减小下一层数据的处理量。
* 第二,能够获得更为抽象的信息,从而防止过拟合,也就是提高了一定的泛化性
* 第三,由于这种抽象性,所以能对输入的微小变化产生更大的容忍,也就是保持了它的不变性,这里的容忍包括图像的少量平移、旋转缩放等操作变化。

 

 

https://www.jianshu.com/p/eb4c2f06d93d

对于一个N\times N的原图像,通过填充P(padding)个像素,经过一个步长是S(stride)的F\times F(filter)的卷积核,最终特征图的尺寸为:
M = \frac{N - F + 2P}{S} + 1

感性认识

 
 

总结

  • 输入大小:W_1\times H_1\times D_1
  • 需要4个超参数:
    • 卷积核个数K
    • 卷积核边长F
    • 步长S
    • 零填充的数量P
  • 输出大小:W_2\times H_2\times D_2
    • W_2 = \frac{W_1 - F + 2P}{S} + 1
    • H_2 = \frac{H_1 - F + 2P}{S} + 1
    • D_2 = K
  • 参数共享,每一个卷积核有F\times F\times D_1个权重参数,共有F\times F\times D_1\times K个权重参数和K个偏差
  • 通常设置K为2的指数,如32,64,128,256,512


posted on 2021-03-03 17:06  Manuel  阅读(2591)  评论(0编辑  收藏  举报