CNN学习笔记:卷积运算
CNN学习笔记:卷积运算
边缘检测
卷积
卷积是一种有效提取图片特征的方法。一般用一个正方形卷积核,遍历图片上的每一个像素点。图片与卷积核重合区域内相对应的每一个像素值乘卷积核 、内相对应点的权重,然后求和,再加上偏置后,最后得到输出图片中的一个像素值。
卷积操作的作用
卷积是一种局部操作,通过一定大小的卷积核作用于局部图像区域获得图像的局部信息。
我们现在使用三种边缘卷积核(亦称滤波器),整体边缘滤波器、横向边缘滤波器和纵向边缘滤波器。
试想,若原图像素(x, y)处可能存在物体边缘,则其四周(x−1,y),(x+1,y),(x, y−1),(x, y+ 1)处像素值应与(x, y)处有显著差异。此时,如作用以整体边缘滤波器Ke,可消除四周像素值差异小的图像区域而保留显著差异区域,以此可检测出物体边缘信息。同理,类似于Kh和Kv的横向、纵向边缘滤波器可以保留横向、纵向的边缘信息。
事实上,卷积网络中的卷积核参数是通过网络训练学出的,除了可以学到类似的横向、纵向边缘滤波器,还可以学到任意角度的边缘滤波器。当然,不仅如此,检测颜色、形状、纹理等众多的基本模式的滤波器都可以包含在一个足够复杂的深层卷积神经网络中。
对立方体卷积
所谓的立方体卷积是指对多通道色彩的图形进行卷积操作。
我们需要有对应通道数的卷积层,此处为3层,每一层处理一个通道,按照卷积操作执行,最后会生成27个数据,将其合计后填入输出矩阵中即可。
填充Padding
在卷积操作中,卷积后的图形将会小于原始图形,并且图形缩小会导致丢失一些边缘信息,我们可以卷积操作之前对输入图形周围进行全零填充,来保证输出图形的尺寸和输入图形的尺寸一致。
设置步长
在上述的卷积过程中,卷积层在原始图形中沿着水平方向每次移动一格,最后输出图形的大小为5*5,当然我们也可以设置移动的间隔,比如为2.这样生成的输出图形的大小就会减小到3*3。
计算公式是这样的:(原始图形大小+2*填充厚度)/步长+1.