CNN卷积神经网络入门整合（科普向）

这是一篇关于CNN入门知识的博客，基本手法是抄、删、改、查，就算是自己的一个笔记吧，以后忘了多看看。

1.边界检测示例
假如你有一张如下的图像，你想让计算机搞清楚图像上有什么物体，你可以做的事情是检测图像的垂直边缘和水平边缘。

如下是一个6*6的灰度图像，构造一个3*3的矩阵，在卷积神经网络中通常称之为filter，对这个6*6的图像进行卷积运算，以左上角的-5计算为例

3*1+0*0+1*-1+1*1+5*0+8*-1+2*1+7*0+2*-1 = -5

（图像和卷积核对应位置元素相乘再累加=卷积结果矩阵的一个元素，不是矩阵乘法）
其它的以此类推，让过滤器在图像上逐步滑动，对整个图像进行卷积计算得到一幅4*4的图像。

卷积计算可以得到图像的边缘，下图0表示图像暗色区域，10为图像比较亮的区域，同样用一个3*3过滤器，对图像进行卷积，得到的图像中间亮，两边暗，亮色区域就对应图像边缘。

通过以下的水平过滤器和垂直过滤器，可以实现图像水平和垂直边缘检测：

在卷积神经网络中把这些过滤器当成我们要学习的参数，卷积神经网络训练的目标就是去理解过滤器的参数。常用的过滤器：

2. padding
　　在上部分中，通过一个3*3的过滤器来对6*6的图像进行卷积，得到了一幅4*4的图像，假设输出图像大小为n*n与过滤器大小为f*f，输出图像大小则为(n−f+1)∗(n−f+1)
　　这样做卷积运算的缺点是，卷积图像的大小会不断缩小; 另外图像的左上角的元素只被一个输出所使用，所以在图像边缘的像素在输出中采用较少，也就意味着你丢掉了很多图像边缘的信息。为了解决这两个问题，就引入了padding操作，也就是在图像卷积操作之前，沿着图像边缘用0进行图像填充。
对于3*3的过滤器，我们填充宽度为1时（加了一圈），就可以保证输出图像和输入图像一样大。

6+1+1-3+1=6：

padding的两种模式：

same padding 在平面外部补0 ，若且步长是1的话图片大小与原来相同。
valid padding 不会超出平面外部，所以输出图像比原来图片要小：（n-f+1）*（n-f+1）

池化层是在卷积层之后的，会降维，减少特征数

3.卷积步长
卷积步长是指过滤器在图像上滑动的距离，上两部分步长都默认为1，如果卷积步长为2，卷积运算过程为：

4.彩色图像的卷积

　　以上讲述的卷积都是灰度图像的，如果想要在RGB（彩色）图像上进行卷积，过滤器的大小不再是3*3而是有3*3*3，最后的3对应为通道数（channels），卷积生成图像中每个像素值为3*3*3过滤器对应位置和图像对应位置相乘累加，过滤器依次在RGB图像上滑动，最终生成图像大小为4*4。注意输出的通道数为1