keras神经网络开发知识笔记

     mnist数据集获取60000个训练样本和10000个测试样本,样本为0-9十个数字,用全连接神经网络进行训练,并测试结果。

      例程采用60000个数据样本进行训练,对于一般的电脑来说,这样训练会比较费时间,学习测试较慢

     所以,可以加入以下几行代码:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
# mnist has 60000 datas,down to 6000 to accelerate
x_train=x_train[:6000]
 
y_train=y_train[:6000]
 
将原始60000个样本只取前6000个样本进行训练
 
例程的核心代码为(部分数值有修改):
 
model = Sequential()
model.add(Dense(512, activation='relu', input_shape=(784,)))
model.add(Dropout(0.2))
model.add(Dense(64, activation='relu'))
model.add(Dropout(0.2))
 
model.add(Dense(num_classes, activation='softmax'))

  依次理解笔记:

   

1
model.add(Dense(512, activation='relu', input_shape=(784,)))

  

     为model添加Dense层,即全链接层,该层有784维输入,512为输出

   

1
model.add(Dropout(0.2))

  

    添加Dropout层,训练时概率性丢弃

1
model.add(Dense(64, activation='relu'))

  

    再次添加Dense层,64维输出(输入为前一层,512维)

1
model.add(Dense(num_classes, activation='softmax'))

  

  再次添加Dense层,10维输出(num_classes=10,即0-9十个数字)

  所以我们大致能够知道,神经网络是输入784维,第一层512维,第二层64维,输出10维。

   在例程末尾,可以添加两句

1
2
3
model.summary()
 
print (model.get_weights())

    

posted @   圆柱模板  阅读(552)  评论(0编辑  收藏  举报
编辑推荐:
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
阅读排行:
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· AI技术革命,工作效率10个最佳AI工具
点击右上角即可分享
微信分享提示