tensorflow学习——02Fashion MNIST数据集神经网络训练

Fashion MMIST数据集是一个现成的数据集,可以直接用来学习深度学习

其中包括70000张图片,10个类别,28*28像素,用于训练神经元网络

 

 

 

 

上面是一个神经元示意图,有3个输入x1 x2 x3,并且有是三个权重w1 w2 w3,  b是他的截距,也是一个常数

 

神经元就把他的输入分别乘以权重加起来,并且加上一个常数,得到一个值z,将这个值放入到激活函数中,函数的输出就是整个神经元的输出

 

 

 

Relu激活函数用于中间层,只有输入是正数的时候才会有输出,输入是负数的时候输出为0

 

Softmax函数将输出压缩到0-1之间

 

 

#加载Fashion MNIST数据集
#第一次执行加载数据集的时候会看到有下载的进度条
import tensorflow as tf
from tensorflow import keras
fashion_mnist=keras.datasets.fashion_mnist
(train_images,train_labels),(test_images,test_labels)=fashion_mnist.load_data()
#(训练的图片,训练图片的标签),(测试的图片,测试图片的标签)

 

print(train_images.shape) #测试图片有60000张,每张图片是28*28像素

 

import matplotlib.pyplot as plt
#如果出现没有matplotlib这个包,可以直接使用conda install matplotlib命令进行下载
plt.imshow(train_images[0]) #显示训练集的第一张图片

 

#构建神经元网络模型
#三层
#第一层用于接受输入,每张图片都是28*28,所以shape是28,28
#第二层是中间层,有128个神经元,这个数字是自己可以任意修改的
#第三层是输出层,分类类别有10个,所以有10个神经元
#model=keras.Sequential([
#    keras.layers.Flatten(input_shape(28,28)),
#    keras.layers.Dense(128,activation=tf.nn.relu),
#    keras.layers.Dense(10,activation=tf.nn.softmax)
#])

model=keras.Sequential() #构建网络模型
model.add(keras.layers.Flatten(input_shape=(28,28))) #输入层
model.add(keras.layers.Dense(128,activation=tf.nn.relu)) #加一个中间层
model.add(keras.layers.Dense(10,activation=tf.nn.softmax)) #加一个输出层

 

model.summary() #观察构造的网络模型

 

 

其中78428*28

100480=(784+1)*128

1290=(128+1)*10

 

 

输入是28*28=784以及一个bias的截距

中间层到输出层就是128个神经元加一个bias截距

上面这是一个全连接的神经网络

如果想要学习神经网络的理论,可以看下面图片中的这个资料

 

 

 

自动终止训练

 

 

如果训练次数过渡会出现过拟合的情况

训练的loss和测试的loss出现分叉的时候一般就是过拟合

 

#神经元网络模型并不是训练次数越多越好

 

class myCallback(tf.keras.callbacks.Callback):
    def on_epoch_end(self,epoch,logs={}):
        if(logs.get('loss')<0.4): #损失函数的值小于0.4的时候
            print("\nloss is low so cancelling training")
            self.model.stop_training=True  #终止训练
            
callbacks=myCallback()
mnist=tf.keras.datasets.fashion_mnist
(training_images,training_labels),(test_images,test_labels)=mnist.load_data()
training_images_scaled=training_images/255
test_images_scaled=test_images/255.0
model=tf.keras.models.Sequential([
    tf.keras.layers.Flatten(),
    tf.keras.layers.Dense(512,activation=tf.nn.relu),
    tf.keras.layers.Dense(10,activation=tf.nn.softmax)
])
model.compile(optimizer="adam",loss="sparse_categorical_crossentropy",metrics=['accuracy'])
model.fit(training_images_scaled,training_labels,epochs=5,callbacks=[callbacks])

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

posted @ 2021-10-13 20:36  白菜茄子  阅读(266)  评论(0编辑  收藏  举报