AlexNet

图片:手写数字的黑白照片
大小:28*28
样本数:69K
类数:10

AlexNet

  • 更深更大的LeNet
  • 主要改进:
    • 丢弃法
    • ReLu
    • MaxPooling
  • 计算机视觉方法论的改变:通过CNN学习特征->Softmax回归

AlexNet架构
image(3x224x224)
11x11 Conv(96), stride 4
更大的核窗口、通道数(模式)、步长,因为图片更大了
3x3 MaxPool, stride 2
更大的池化窗口,使用最大池化层
5x5 Conv(256), pad 2
应该识别更多的模式->更大的数据通道
3x3 MaxPool, stride 2
5x5 Conv(384), pad 1
5x5 Conv(384), pad 1
5x5 Conv(384), pad 1
新加了3层卷积层
3x3 MaxPool, stride 2
Dense(4096)
做1000类的分类
Dense(4096)
Dense(1000)

更多细节

  • 激活函数从sigmoid变到了ReLu (减缓梯度消失)
  • 隐藏全连接层后加入了丢弃层
  • 数据增强
posted @   prettysky  阅读(38)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· .NET10 - 预览版1新功能体验(一)
点击右上角即可分享
微信分享提示