欢迎这位怪蜀黍来到《Python机器学习(七十四)Keras 预处理数据 - 大码王 - 博客园》

关闭页面特效

首先需要调整数据集的形状,让其包含图像的位深信息。

打印原始数据集的形状:

>>> print (X_train.shape)
(60000, 28, 28)

可以看到并没有包含图像的位深信息。

MNIST是灰度图像,位深为1,我们将数据集从形状(n,宽度,高度)转换为(n,位深,宽度,高度)。

if K.image_data_format() == 'channels_first':
    X_train = X_train.reshape(X_train.shape[0], 1, 28, 28)
    X_test = X_test.reshape(X_test.shape[0], 1, 28, 28)
    input_shape = (1, 28, 28)
else:
    X_train = X_train.reshape(X_train.shape[0], 28, 28, 1)
    X_test = X_test.reshape(X_test.shape[0], 28, 28, 1)
    input_shape = (28, 28, 1)

Keras的底层实现库可能是TensorFlow或Theano,它们对数据集的形状要求是不一样的,TensorFlow要求通道在前channels_first,Theano相反。此处,我们使用TensorFlow的格式。

重新打印X_train的形状:

print (X_train.shape)
# (60000, 1, 28, 28)

可以看到,形状已经变化了,包含了图像的位深信息。

接下来,输入数据预处理步骤是将数据类型转换为float32,并将数据值归一化到[0,1]范围内。

X_train = X_train.astype('float32')
X_test = X_test.astype('float32')
X_train /= 255
X_test /= 255

 

 posted on   大码王  阅读(605)  评论(0编辑  收藏  举报
编辑推荐:
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
阅读排行:
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· AI技术革命,工作效率10个最佳AI工具

成都

复制代码

喜欢请打赏

扫描二维码打赏

了解更多

点击右上角即可分享
微信分享提示