VGGNet(Very Deep Convolutional Networks)

1.introduction

● 采用3x3的小卷积核应用在比较深的网络里

● 结果不错,赢得了2014 Imagenet挑战赛上,定位和分类赛道的冠军

 

2. Conv Arc

介绍了网络的结构配置:

● 固定224x224 RGB图像输入

● 1x1的卷积进行输入通道的线性变换

● 卷积步长固定为1,padding是1,是想让图像的像素固定

● 加上maxpoling,将卷积层、池化层堆叠,进行模型的模块化

● 采用的ReLu函数

Tabel1 : 网络参数图

 

重点:

两个3x3卷积代替一个5x5的卷积,因为感受野就是5x5。三个3x3卷积核就可以代替一个7x7的卷积核,大大减少了参数量。

 

但是放眼今天,2022年的CVPR上提出采用大卷积核,因为大卷积核学习的效果更好,(比如学习一件事情,一步到位就学完,比分三步学要好),实验结果也表明利用大卷积核的学习结果更好,且经过计算上的优化使得大卷积核学习更快。

CVPR 2022 | RepLKNet:超大卷积核,大到31x31,越大越暴力,涨点又高效! - 知乎 (zhihu.com)

 

3.分类框架

暂时不需要去复现的话,不用太关注

复现可以去关注一些细节

 

网络越深,“折的次数越多”,越能学习到模型真正长什么样子,这些数据的拓扑空间长什么样子

posted on 2022-10-01 16:04  黑芒猩  阅读(37)  评论(0编辑  收藏  举报