VGG学习笔记

1.网络结构

1.1.结构

《VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION》这篇论文探讨卷积网络深度对分类精确率的影响。它主要通过设置几种配置相同但深度不同的卷积神经网络，来进行实验。配置如下：

（1）输入是224*224的RGB图像。

（2）卷积层使用的卷积核是3*3，stride=1，padding=1，因此可以保证输入尺度等于输出尺度。此外还使用了1*1的卷积核，它可以看成是输入通道的线性转换。

（3）最大池化层采用2*2，stride=2，padding=0。故经过池化层后尺度减半。这是一个很好的性质。

（4）第一层通道数是64，此后每经过一个最大池化层，通道数就*2。所以根据（2）（3）（4）的配置，VGG网络结构图可以说是十分工整美观的。

（5）最后3个全连接层：2个4096，最后一个1000。不同深度的网络变化的只是卷积部分，前链接部分都是一样的。

1.2.小卷积核

AlexNet有用到大卷积核7*7，而VGG使用的是小卷积核3*3（还有1*1，但这个不讨论）。据论文说，用多个小卷积核的有效感受野和用一个大的卷积核的有效感受野差不多，比如2个3*3可以代替1个5*5，3个3*3可以代替一个7*7。但采用多个小卷积核却有两个优点：

（1）总的参数可以变少。如：2*3*3=18 < 5*5=25，又如：3*3*3=29 < 7*7=49。

（2）原文“we incorporate three non-linear rectification layers instead of a single one, which makes the decision function more discriminative”，意思大概是用三个能比用一个更有判别力？不太理解理解这句话，个人的看法就是多个的容错性更好吧？毕竟如果仅有的一个崩了，那就break down了，但如果有3个，其中一个崩了，那也还剩2个工作，不会break down。

1.3.VGG16结构图

posted on 2020-07-25 00:02 ZhicongHou 阅读(145) 评论(0) 编辑收藏举报

刷新页面返回顶部