keras神经网络开发知识笔记
mnist数据集获取60000个训练样本和10000个测试样本,样本为0-9十个数字,用全连接神经网络进行训练,并测试结果。
例程采用60000个数据样本进行训练,对于一般的电脑来说,这样训练会比较费时间,学习测试较慢
所以,可以加入以下几行代码:
# mnist has 60000 datas,down to 6000 to accelerate x_train=x_train[:6000] y_train=y_train[:6000] 将原始60000个样本只取前6000个样本进行训练 例程的核心代码为(部分数值有修改): model = Sequential() model.add(Dense(512, activation='relu', input_shape=(784,))) model.add(Dropout(0.2)) model.add(Dense(64, activation='relu')) model.add(Dropout(0.2)) model.add(Dense(num_classes, activation='softmax'))
依次理解笔记:
model.add(Dense(512, activation='relu', input_shape=(784,)))
为model添加Dense层,即全链接层,该层有784维输入,512为输出
model.add(Dropout(0.2))
添加Dropout层,训练时概率性丢弃
model.add(Dense(64, activation='relu'))
再次添加Dense层,64维输出(输入为前一层,512维)
model.add(Dense(num_classes, activation='softmax'))
再次添加Dense层,10维输出(num_classes=10,即0-9十个数字)
所以我们大致能够知道,神经网络是输入784维,第一层512维,第二层64维,输出10维。
在例程末尾,可以添加两句
model.summary() print (model.get_weights())
千行代码,Bug何处藏。 纵使上线又怎样,朝令改,夕断肠。