MNIST是一个经典的深度学习和计算机视觉的数据集,里面包含了0-9的手写数字图片,开发人员可使用此数据集来训练和测试神经网络,训练后的神经网络可以识别手写数字。
Keras库已经包含了这个数据集,可以从Keras库中加载:
from keras.datasets import mnist # 将预打乱的MNIST数据加载到训练和测试集中 (X_train, y_train), (X_test, y_test) = mnist.load_data() # Downloading data from https://s3.amazonaws.com/img-datasets/mnist.npz # 11493376/11490434 [==============================] - 483s 42us/step
可以查看数据集的形状:
print (X_train.shape) # (60000, 28, 28)
可以看到,训练集中有60000个样本,每个图像都是28像素x28像素。要查看手写数字图像,可以使用matplotlib绘制,下面绘制MNIST数据集中的第一个图像:
from matplotlib import pyplot as plt plt.imshow(X_train[0]) plt.show()
这是图像输出:
一般来说,当开发深度学习应用时,在进行任何算法工作之前,可视化地绘制数据是很有用的。这是一个快速的完整性检查,可以防止低级错误(比如搞错数据维度)。
本文来自博客园,作者:大码王,转载请注明原文链接:https://www.cnblogs.com/huanghanyu/
分类:
人工智能之机器学习
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· AI技术革命,工作效率10个最佳AI工具