卷积层----个人总结
百度百科链接:点击这里
定义:卷积神经网络中每层卷积层(Convolutional layer)由若干卷积单元组成,每个卷积单元的参数都是通过反向传播算法最佳化得到的。卷积运算的目的是提取输入的不同特征,第一层卷积层可能只能提取一些低级的特征如边缘、线条和角等层级,更多层的网路能从低级特征中迭代提取更复杂的特征。
卷积神经网络中,通过输入卷积核来进行卷积操作,使输入单元(或图像或特征映射)和输出单元(特征映射)之间的连接是稀疏的,这样能够减少需要训练参数的数量,从而加快网络的计算速度。
卷积操作的参数共享特点,主要提现在模型中同一组参数可以被多个函数或者操作共同使用。在卷积神经网络中,针对不同的输入会利用同样的卷积核来获得相应的输出。这种参数共享的特点是只需要训练一个特征集。由于卷积核尺寸可以远小于输入尺寸,即减少需要学习的参数的数量,并且针对每个卷积层可以使用多个卷积核获取输入的特征映射,对数据具有很强的特征提取能力,并且在卷积运算之后,使得卷积神经网络结构对输入的图像具有平移不变的性质
在pytorch中对于不同使用场景有不同的卷积算法,有一维卷积、二维卷积、三维卷积与转置卷积,下面以二维卷积使用为例来介绍其详细使用方法:
使用方法:
以书上torch.nn.Conv2d( in_channels ,
out_channels ,
kernel_size ,
stride=1 ,
padding= 0 ,
dilation=1 ,
groups=1 ,
bias=True) 为例展开介绍
in_channels :(整数)输入图像的通道数。
out_channels:(整数)经过卷积运算后,输出特征映射的数量。
kernel_size :(整数或者数组)卷积核的大小。
stride:(整数或者数组,正数)卷积的步长,默认为1.
padding:(整数或者数组,正数)在输入两边进行0填充的数量,默认为0。
dilation:(整数或者数组,正数)卷积核之间的步幅,该参数可调整为空洞卷积的空洞大小,默认为1。
groups:(整数,正数)从输入通道到输出通道的阻塞连接数。
bias:(布尔值,正数)如果是bias=True,则添加偏置,默认为True。
输出尺寸的计算方法:
高
H_out = (H_in+2*padding[0]-dilation[0]*(kernel_size[0]-1)-1) / stride[0]
宽
W_out = (W_out+2*padding[1]-dilation[1]*(kernel_size[1]-1)-1) / stride[1]
通道数:
解释一
(百度百科:图像通道数点击这里)
根据photoshop上解释:在Photoshop中有一个很重要概念叫图像通道,在RGB色彩模式下就是指那单独的红色、绿色、蓝色部分。也就是说,一幅完整的图像,是由红色绿色蓝色三个通道组成的。他们共同作用产生了完整的图像。
原图(RGB):
单通道图像:
灰度中越偏白的部分,表示色光亮度值越高,越偏黑的部分则表示亮度值越低。纯白亮度级是0,纯黑亮度级是255
解释二(详细见这里:点击这里)
通道作为图象的组成部分,是与图象的格式密不可分的,图象颜色、格式的不同决定了通道的数量和模式,在通道面板中可以直观的看到 在photoshop中涉及的通道主要有:
⑴ 复合通道(Compound Channel) 复合通道不包含任何信息,实际上它只是同时预览并编辑所有颜色通道的一个快捷方式。它通常被用来在单独编辑完一个或多个颜色通道后使通道面板返回到它的默认状态。对于不同模式的图象,其通道的数量是不一样的。在photoshop之中,通道涉及三个模式。对于一个RGB图象,有RGB、R、G、B四个通道;对于一个CMYK 图象,有CMYK、C、M、Y、K五个通道;对于一个Lab模式的图象,有Lab、L、a、b四个通道。
⑵ 颜色通道(Color Channel) 当你在photoshop中编辑图象时,实际上就是在编辑颜色通道。这些通道把图象分解成一个或多个色彩成分,图象的模式决定了颜色通道的数量,RGB模式有3个颜色通道,CMYK图象有4个颜色通道,灰度图只有一个颜色通道,它们包含了所有将被打印或显示的颜色。
⑶ 专色通道(Spot Channel) 专色通道是一种特殊的颜色通道,它可以使用除了青色、洋红(有人叫品红)、黄色、黑色以外的颜色来绘制图象。因为专色通道一般人用的较少且多与打印相关,所以我把它放在后面的内容中讲述。
⑷ Alpha通道(Alpha Channel) Alpha 通道是计算机图形学中的术语,指的是特别的通道。有时,它特指透明信息,但通常的意思是“非彩色”通道。这是我们真正需要了解的通道,可以说我们在 photoshop中制作出的各种特殊效果都离不开Alpha通道,它最基本的用处在于保存选取范围,并不会影响图象的显示和印刷效果。当图象输出到视频,Alpha通道也可以用来决定显示区域。如果你曾经稍微深入到After Effects这类非线性编辑软件中去过,就会更加清楚。
⑸ 单色通道 这种通道的产生比较特别,也可以说是非正常的。试一下,如果你在通道面板中随便删除其中一个通道,就会发现所有的通道都变成“黑白”的,原有的彩色通道即使不删除也变成灰度的了。因此显而易见 ,是没有图像通道的,他只是归于通道的一种属性。