Tensorflow官方文档中文版——第一章
第一示例:
import tensorflow as tf import numpy as np x_data=np.float32(np.random.rand(2,100))#随机输入 y_data=np.dot([0.1,0.2],x_data)+0.3#点乘 b=tf.Variable(tf.zeros([1])) W=tf.Variable(tf.random_uniform([1,2],-1,1))#-1到1之间的均匀分布中取出值构成[1*2]的矩阵 y=tf.matmul(W,x_data)+b#矩阵计算 loss=tf.reduce_mean(tf.square(y-y_data))#计算平均损失函数 optimizer=tf.train.GradientDescentOptimizer(0.5)#梯度下降优化 train=optimizer.minimize(loss)#train 使loss最小化 init=tf.initialize_all_variables()#初始化所有变量 sess=tf.Session()## 启动图 (graph) sess.run(init) # 拟合平面 for step in range(0,201): sess.run(train) if (step %20==0): print (step,sess.run(W),sess.run(b))
下载安装
略
基本使用
图(graph):表示计算任务
会话(Session):用于执行图
张量(tensor):用于表示数据
变量(variable):用于维护状态
feed和fetch:可以为任意操作赋值或从中获取数据
TensorFlow 是一个编程系统,使用图来表示计算任务。图中的节点被称之为op(operation的缩写)。一个op获得0个或多个Tensor,执行计算,产生0个或多个Tensor.每个 Tensor 是一个类型化的多维数组. 例如, 你可以将一小组图像集表示为一个四维浮点数数组, 这四个维度分别是[batch, height, width, channels] .
一个 TensorFlow 图描述了计算的过程. 为了进行计算, 图必须在会话里被启动. 会话将图的 op 分发到诸如 CPU 或 GPU 之类的设备上, 同时提供执行 op 的方法. 这些方法执行后, 将产生的 tensor 返回. 在 Python 语言中, 返回的 tensor 是numpy ndarray 对象; 在 C 和 C++ 语言中, 返回的 tensor 是tensorflow::Tensor 实例.
TensorFlow 程序通常被组织成一个构建阶段和一个执行阶段. 在构建阶段, op 的执行步骤 被描述成一个图. 在执行阶段, 使用会话执行执行图中的 op.
构建图
构建图的第一步, 是创建源 op (source op). 源 op 不需要任何输入, 例如常量 (Constant) . 源 op 的输出被传递给其它 op 做运算.Python 库中, op 构造器的返回值代表被构造出的 op 的输出, 这些返回值可以传递给其它 op 构造器作为输入.TensorFlow Python 库有一个默认图 (default graph), op 构造器可以为其增加节点. 这个默认图对 许多程序来说已经足够用了.
import tensorflow as tf #创建一个常量op,产生一个1×2矩阵,这个op被作为一个节点加到默认图中 #构造器的返回值代表该常量op的返回值 matrix1=tf.constant([[3,3]]) #创建另外一个常量op,产生一个2×1矩阵 matrix2=tf.constant([[2],[2]]) #创建一个矩阵乘法matmul op,把‘matrix1’和‘matrix2’作为输入 #返回‘product’代表矩阵乘法的结果 product=tf.matmul(matrix1,matrix2) #启动默认图 sess=tf.Session() #调用sess的‘run()(’方法来执行矩阵乘法op,传入‘product’作为该方法的参数 result=sess.run(product) print(result) sess.close()
默认图现在有三个节点, 两个constant() op, 和一个matmul() op.
为了真正进行矩阵相乘运算, 并得到矩阵乘法的结果, 你必须在会话里启动这个图.
在一个会话中启动图
构造阶段完成后, 才能启动图. 启动图的第一步是创建一个Session 对象,如果无任何创建参数, 会话构造器将启动默认图.
Session 对象在使用完后需要关闭以释放资源. 除了显式调用 close 外, 也可以使用 "with" 代码块 来自动完成关闭动作.
with tf.Session() as sess: result=sess.run([product]) print(result)
在实现上, TensorFlow 将图形定义转换成分布式执行的操作, 以充分利用可用的计算资源(如 CPU 或 GPU). 一般你不需要显式指定使用 CPU 还是 GPU, TensorFlow 能自动检测. 如果检测到 GPU, TensorFlow 会尽可能地利用找到的第一个 GPU 来执行操作.
如果机器上有超过一个可用的 GPU, 除第一个外的其它 GPU 默认是不参与计算的. 为了让 TensorFlow 使用这些GPU, 你必须将 op 明确指派给它们执行. with...Device 语句用来指派特定的 CPU 或 GPU 执行操作:
import tensorflow as tf with tf.Session(config=tf.ConfigProto(allow_soft_placement=True, log_device_placement=True)) as sess: with tf.device("/gpu:0"): matrix1=tf.constant([[3,3]]) matrix2=tf.constant([[2],[2]]) product=tf.matmul(matrix1,matrix2) result=sess.run(product) print(result)
这里Session中不加入allow_soft_placement=True会出现说gpu没有支持的核,原因是因为在tensorflow中,定义在图中的op,有的只能再cup中运行,gpu中不支持。解决方法就是让op自动识别,让它选择在合适的地方运行即可。如果op中有标识的话,在运行的时候指定在cup上执行,如果无法区分的话,可以试试在sess.run的时候加入allow_soft_placement=True。
交互式使用
文档中的 Python 示例使用一个会话Session 来 启动图, 并调用Session.run() 方法执行操作.
为了便于使用诸如IPython 之类的 Python 交互环境, 可以使用InteractiveSession 代替Session 类, 使用Tensor.eval() 和Operation.run() 方法代替Session.run() . 这样可以避免使用一个变量来持有会话.
import tensorflow as tf sess=tf.InteractiveSession() x=tf.Variable([1,2]) a=tf.constant([3,3]) # 使用初始化器 initializer op 的 run() 方法初始化 'x' x.initializer.run() sub=tf.subtract(x,a)#tf.sub已经不存在了 print(sub.eval())
Tensor
TensorFlow 程序使用 tensor 数据结构来代表所有的数据, 计算图中, 操作间传递的数据都是 tensor. 你可以把 TensorFlow tensor 看作是一个 n 维的数组或列表. 一个 tensor 包含一个静态类型 rank, 和 一个 shape.
变量
Variables for more details. 变量维护图执行过程中的状态信息. 下面的例子演示了如何使用变量实现一个简单的计数器.
import tensorflow as tf #创建一个变量,初始化为标量0 state=tf.Variable(0,name="counter") #创建一个op,其作用使state增加1 one=tf.constant(1) new_value=tf.add(state,one) update=tf.assign(state,new_value) # 启动图后, 变量必须先经过`初始化` (init) op 初始化, # 首先必须增加一个`初始化` op 到图中. init_op=tf.initialize_all_variables() with tf.Session(config=tf.ConfigProto(allow_soft_placement=True, log_device_placement=True)) as sess: sess.run(init_op) print(sess.run(state)) for _ in range(3): sess.run(update) print(sess.run(state))
代码中assign() 操作是图所描绘的表达式的一部分, 正如add() 操作一样. 所以在调用run() 执行表达式之前, 它并不会真正执行赋值操作.
通常会将一个统计模型中的参数表示为一组变量. 例如, 你可以将一个神经网络的权重作为某个变量存储在一个tensor 中. 在训练过程中, 通过重复运行训练图, 更新这个 tensor.
Fetch
为了取回操作的输出内容, 可以在使用Session 对象的run() 调用 执行图时, 传入一些 tensor, 这些 tensor 会帮助你取回结果. 在之前的例子里, 我们只取回了单个节点state , 但是你也可以取回多个 tensor:
import tensorflow as tf input1=tf.constant(3) input2=tf.constant(2) input3=tf.constant(5) intermed=tf.add(input2,input3) mul=tf.multiply(input1,intermed) with tf.Session(config=tf.ConfigProto(allow_soft_placement=True, log_device_placement=True)) as sess: result=sess.run([mul,intermed]) print(result)
需要获取的多个 tensor 值,在 op 的一次运行中一起获得(而不是逐个去获取 tensor)。
Feed
上述示例在计算图中引入了 tensor, 以常量或变量的形式存储. TensorFlow 还提供了 feed 机制, 该机制可以临时替代图中的任意操作中的 tensor 可以对图中任何操作提交补丁, 直接插入一个 tensor.feed 使用一个 tensor 值临时替换一个操作的输出结果. 你可以提供 feed 数据作为run() 调用的参数. feed只在调用它的方法内有效, 方法结束, feed 就会消失. 最常见的用例是将某些特殊的操作指定为 "feed" 操作,标记的方法是使用 tf.placeholder() 为这些操作创建占位符.
import tensorflow as tf input1=tf.placeholder(tf.float32) input2=tf.placeholder(tf.float32) output=tf.multiply(input1,input2) with tf.Session(config=tf.ConfigProto(allow_soft_placement=True, log_device_placement=True)) as sess: print(sess.run([output],feed_dict={input1:[7],input2:[2]}))
for a larger-scale example of feeds. 如果没有正确提供 feed, placeholder() 操作将会产生错误.