VGGNet(Very Deep Convolutional Networks)
1.introduction
● 采用3x3的小卷积核应用在比较深的网络里
● 结果不错,赢得了2014 Imagenet挑战赛上,定位和分类赛道的冠军
2. Conv Arc
介绍了网络的结构配置:
● 固定224x224 RGB图像输入
● 1x1的卷积进行输入通道的线性变换
● 卷积步长固定为1,padding是1,是想让图像的像素固定
● 加上maxpoling,将卷积层、池化层堆叠,进行模型的模块化
● 采用的ReLu函数
Tabel1 : 网络参数图
重点:
两个3x3卷积代替一个5x5的卷积,因为感受野就是5x5。三个3x3卷积核就可以代替一个7x7的卷积核,大大减少了参数量。
但是放眼今天,2022年的CVPR上提出采用大卷积核,因为大卷积核学习的效果更好,(比如学习一件事情,一步到位就学完,比分三步学要好),实验结果也表明利用大卷积核的学习结果更好,且经过计算上的优化使得大卷积核学习更快。
3.分类框架
暂时不需要去复现的话,不用太关注
复现可以去关注一些细节
网络越深,“折的次数越多”,越能学习到模型真正长什么样子,这些数据的拓扑空间长什么样子