7.3.2 NiN模型

可以发现AlexNet和VGG最后面的网络都是全连接层,但是有如下问题
image
基本上所有参数都集中在最后的全连接层(这样导致计算慢内存大还很容易过拟合,比如我们期望三层全连接层学习完所有特征,但是一层就把所有特征学习完了)
所以我们要替换掉最后的全连接层。我们可以使用1×1的卷积层来替换,这就是NiN做的事(我们说1×1卷积层等价于全连接层,那么单从这句话上看,似乎没有得到改进。实际上我们可以去比较一下1×1的卷积层和全连接层的区别,前者是学习同一像素不同通道之间的关系,而后者是将所有像素所有通道结合在一起学习,也就是说前者更简单)
NiN架构如下
image
最后的“输入通道是类别数”的意思就是对每一个通道都拿出一个值,就把这个值当做某个类别的预测,然后做Softmax
image

image

posted @   最爱丁珰  阅读(3)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗?
· 【译】Visual Studio 中新的强大生产力特性
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 【设计模式】告别冗长if-else语句:使用策略模式优化代码结构
历史上的今天:
2024-02-21 Fractal Origami
2024-02-21 Did We Get Everything Covered?
2024-02-21 We Got Everything Covered!
2024-02-21 Permutation of Given
2024-02-21 ace5 and Task Order
点击右上角即可分享
微信分享提示