tensorflow mnist模块详解

tensorflow的官方文档是以mnist数据集为例子开始的.文档本身没有介绍tensorflow.contrib.learn.python.learn.datasets.mnist模块.要想用tensorflow处理自己的数据集必须100%把这个模块弄明白.之后可以模仿mnist模块,定义自己的数据集.

extract_images方法

该方法是从压缩包中把数据读出来,将数据存入numpy的数组中.代码细节看参考资料1.最终返回一个n28281的numpy数组.n代表数据集中有几张图片.2828代表图片长,宽.1代表通道数(黑白图片通道数为1).

extract_labels

如果one_hot为False,返回一个长度为n的numpy数组.每个元素代表图片上的数字.如果one_hot为True,返回一个n*10的numpy数组,里面的值非0即1.每一行代表一个图片上的数字,第几列为1,就代表图片上是几.从压缩文件中读取数据的方法和上面的思路完全一致.

DataSet

在mnist中定义._images是n*784的numpy型数组,_labels是长度为n的数组(one_hot为False时)

read_data_sets

返回Datasets. Datasets在tensorflow.contrib.learn.python.learn.datasets.mnist.base中定义.Datasets是一个元组,里面有3个元素train,validation,test.在这个函数中,这3个元素都被初始化成DataSet型. next_batch的非常简单,每次返回batch_size个代表图片的numpy型数组和标签.

问题

fake_data为True有什么作用

参考资料

  1. python读取,显示,保存mnist图片
  2. mnist模块源代码

posted on   荷楠仁  阅读(1103)  评论(0编辑  收藏  举报

编辑推荐:
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
阅读排行:
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗?
· 【译】Visual Studio 中新的强大生产力特性
· 【设计模式】告别冗长if-else语句:使用策略模式优化代码结构
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义

导航

统计

点击右上角即可分享
微信分享提示