VGGNet（Very Deep Convolutional Networks）

1.introduction

● 采用3x3的小卷积核应用在比较深的网络里

● 结果不错，赢得了2014 Imagenet挑战赛上，定位和分类赛道的冠军

介绍了网络的结构配置：

● 固定224x224 RGB图像输入

● 1x1的卷积进行输入通道的线性变换

● 卷积步长固定为1，padding是1，是想让图像的像素固定

● 加上maxpoling，将卷积层、池化层堆叠，进行模型的模块化

● 采用的ReLu函数

Tabel1 ：网络参数图

重点：

两个3x3卷积代替一个5x5的卷积，因为感受野就是5x5。三个3x3卷积核就可以代替一个7x7的卷积核，大大减少了参数量。

但是放眼今天，2022年的CVPR上提出采用大卷积核，因为大卷积核学习的效果更好，（比如学习一件事情，一步到位就学完，比分三步学要好），实验结果也表明利用大卷积核的学习结果更好，且经过计算上的优化使得大卷积核学习更快。

暂时不需要去复现的话，不用太关注

复现可以去关注一些细节

网络越深，“折的次数越多”，越能学习到模型真正长什么样子，这些数据的拓扑空间长什么样子

posted on 2022-10-01 16:04 黑芒猩阅读(37) 评论(0) 编辑收藏举报

刷新页面返回顶部