理解CNN中的特征图feature map
理解CNN中的特征图feature map
先来说说CNN的过滤器是什么?
过滤器也叫卷积核(kernel),它们通常都是固定大小的宫格:\(3\times 3\)、\(5\times5\)、\(7\times7\)。这些过滤器决定了模型关注图像的那些像素部分。
以Resnet-50卷积神经网络的\(7\times7\)滤波器为例,滤波器是长这样的
feature map:
一张图片,通常有RGB三个通道,通过卷积核进行卷积运算,便会产生一层层的特征图(feature map)。层与层之间会有若干个卷积核(kernel),上一层的每个特征图跟每个卷积核做卷积,就会产生下一层的一个特征图。也就是说当图像像素值经过卷积核后的到的东西就是特征图。
我们用上面\(7\times7\)的卷积核对图片进行卷积一下,得到:
通常,经过多少个卷积核过滤就会产生多少个特征图,也就是下图中的“豆腐皮儿”层数,同时也是该层的深度。网络越深意味着这一层的特征图数目就越多,随着网络的加深,特征图的长宽尺寸缩小,本卷积层的每个特征图提取的特征就越具代表性,所以通常后一层卷积层需要增加特征图的数量,也就是说用更多的卷积核进行卷积操作,才能充分地提取前一层的特征。
参考:
理解卷积神经网络CNN中的特征图 feature map
卷积神经网络CNN/Pytorch,如何理解特征图Feature map?