python读取mnist
python读取mnist
其实就是python怎么读取binnary file
mnist的结构如下,选取train-images
TRAINING SET IMAGE FILE (train-images-idx3-ubyte):
[offset] [type] [value] [description]
0000 32 bit integer 0x00000803(2051) magic number
0004 32 bit integer 60000 number of images
0008 32 bit integer 28 number of rows
0012 32 bit integer 28 number of columns
0016 unsigned byte ?? pixel
0017 unsigned byte ?? pixel
........
xxxx unsigned byte ?? pixel
也就是之前我们要读取4个 32 bit integer
试过很多方法,觉得最方便的,至少对我来说还是使用
struct.unpack_from()
filename = 'train-images.idx3-ubyte' binfile = open (filename , 'rb' ) buf = binfile.read() |
先使用二进制方式把文件都读进来
index = 0 magic, numImages , numRows , numColumns = struct.unpack_from( '>IIII' , buf , index) index + = struct.calcsize( '>IIII' ) |
然后使用struc.unpack_from
'>IIII'是说使用大端法读取4个unsinged int32
然后读取一个图片测试是否读取成功
im = struct.unpack_from( '>784B' ,buf, index) index + = struct.calcsize( '>784B' ) im = np.array(im) im = im.reshape( 28 , 28 ) fig = plt.figure() plotwindow = fig.add_subplot( 111 ) plt.imshow(im , cmap = 'gray' ) plt.show() |
'>784B'的意思就是用大端法读取784个unsigned byte
完整代码如下
import numpy as np import struct import matplotlib.pyplot as plt filename = 'train-images.idx3-ubyte' binfile = open (filename , 'rb' ) buf = binfile.read() index = 0 magic, numImages , numRows , numColumns = struct.unpack_from( '>IIII' , buf , index) index + = struct.calcsize( '>IIII' ) im = struct.unpack_from( '>784B' ,buf, index) index + = struct.calcsize( '>784B' ) im = np.array(im) im = im.reshape( 28 , 28 ) fig = plt.figure() plotwindow = fig.add_subplot( 111 ) plt.imshow(im , cmap = 'gray' ) plt.show() |
只是为了测试是否成功所以只读了一张图片
赶脚应该是读对了哈。。。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· 写一个简单的SQL生成工具
· AI 智能体引爆开源社区「GitHub 热点速览」
· C#/.NET/.NET Core技术前沿周刊 | 第 29 期(2025年3.1-3.9)