CNN数据的处理和简化
32*32*3中的3是RGB的维度,而28*28*6中的6是filter的维度
如果增加PAD=2(即上下左右各加两行列的0数值,那么卷积后还是32*32的图像)
卷积层还有一个特性就是“权值共享”原则。如下图:
池化是卷积之后的特征聚合,池化操作一般有两种,一种是Avy Pooling,一种是max Pooling。对一个局部区域取一个最具有代表性的值来表示这个区域的特征,可以是特征图片进行降维。最常见的是2*2区域最大值池化
2 | 3 | 5 | 9 | 2 | 5 | 6 | 2 |
2 | 10 | 19 | 17 | 14 | 11 | 6 | 15 |
1 | 7 | 11 | 12 | 12 | 21 | 2 | 5 |
1 | 3 | 2 | 3 | 2 | 4 | 1 | 3 |
1 | 8 | 22 | 10 | 11 | 12 | 11 | 13 |
2 | 3 | 17 | 11 | 0 | 12 | 14 | 22 |
2 | 2 | 15 | 4 | 5 | 8 | 9 | 15 |
12 | 10 | 12 | 11 | 3 | 5 | 5 | 12 |
10 | 19 | 14 | 15 |
7 | 12 | 21 | 5 |
8 | 22 | 12 | 22 |
12 | 15 | 8 | 15 |
左边是8*8的输入,经过2*2maxpooling后生成4*4输出,其方法是在输入的每个2*2的区域取一个像素点的最大值,用这个值代替原图像2*2区域的值,并且进行降维。
此做法的目的:对特征进行聚合,并且在局部区域是特征具有了一定的invariance。
全连接层:连接所有的特征,将输出值送给分类器(如softmax分类器)。