TensorFlow深度学习入门笔记(二)基本概念与代码1
关注公众号“从机器学习到深度学习那些事”获取更多最新资料
写在前面
学习建议:以下学习过程中有不理解可以简单查找下资料,但不必纠结(比如非得深究某一个函数等),尽量快速的学一遍,不求甚解无妨。因为有些知识现在陌生,可能学到后面就发现之前的问题都很自然的理解与会用了。多实操代码,不能只复制代码,或者感觉懂了就只看。熟能生巧,我亦无他,唯手熟尔
计算模型:计算图
计算图是TensorFlow中最基本的一个概念,TensorFlow中所有的计算都会被转化为计算图上的节点。TensorFlow名字中的tensor即张量,可以理解为多维数组。tensor表明了TensorFlow的数据结构,即它处理的都是一个个tensor,flow-流体现的是TensorFlow的计算模型。张量这定义的模型中流动,转化成不同的tensor,最终完成任务。
TensorFlow也是一种懒操作,即先画图,并没有真正的开始计算,只是定义了各个计算节点,定义了计算逻辑,只有最终调用run()时才会真正开始计算,有点像scala的模式。TensorFlow中的每一个计算都是计算图中的一个节点,而节点之间的边描述了计算之间的依赖关系(计算逻辑)。
具体的计算网络结构,可以通过TensorFlow中专门的可视化工具TensorBoard画出来。TensorBoard后面会专门讲。
TensorFlow程序分为两个阶段,一是定义计算(图的形成),二是执行计算(run)
先看一段代码,我尽量把注释写满点,开始接触不懂没关系,先跟着套路走,本地跑下代码
代码
import tensorflow as tf # 几乎默认这种,咱也不免俗 a = tf.constant([1.0,2.0]) # 定义一个变量a,并初始化 b = tf.constant([3.0,4.0]) # 定义一个变量b ,并初始化 add = a + b # 定义计算 (这时并没有真正计算,只是定义了计算图逻辑) print(add) # 打印出 add 从结果看(输出 Tensor("add:0", shape=(2,), dtype=float32)),这也只是一种定义没有真正计算出a+b的结果, # 三个节点 a , b , add 。注意这里没有显式的指定计算图(tf.Graph),则会通过tf.get_default_graph()获取默认的计算图 print(a.graph is tf.get_default_graph()) # 输出 True # 补充:初学时总是混淆这两个函数tf.multiply()与tf.matmul(),在这里记录下 # tensoflow 中tf.multiply(a,b)与tf.matmul(c,d)比较 a = tf.constant([1.0,2.0]) # 定义一个变量a,并初始化 b = tf.constant([3.0,4.0]) # 定义一个变量b ,并初始化 c = tf.constant([1, 2, 3, 4, 5, 6], shape=[2, 3]) d = tf.constant([7, 8, 9, 10, 11, 12], shape=[3, 2]) # 定义一个变量d ,并初始化 product1 = tf.multiply(a,b) # 对应位置相乘 product2 = tf.matmul(c,d) # 矩阵的乘法,得到的结果是一个矩阵,行乘列作为对应位置的元素 with tf.Session() as sess: print(sess.run(product1)) print(sess.run(product2))
再来一段在不同计算图中的例子
# 下面定义不同的计算图,并执行计算 import tensorflow as tf g1 = tf.Graph() with g1.as_default(): # 在计算图g1中定义变量v,并初始化为0 v = tf.get_variable('v', shape=[1], initializer=tf.zeros_initializer()) # # 初始化为常数 # v = tf.get_variable('v',initializer=tf.constant([2.0,3.1])) g2 = tf.Graph() with g2.as_default(): # 在计算图g2中定义变量v,并初始化为1 v = tf.get_variable('v', shape=[1], initializer=tf.ones_initializer()) # 在计算图g1 中读取变量 'v'的值,输出 with tf.Session(graph=g1) as sess: # 这种也几乎是默认,参考官网 # TensorFlow中,run之前需要先初始化 tf.global_variables_initializer().run() with tf.variable_scope('',reuse=True): # 根据计算图g1初始化的值输出 print(sess.run(tf.get_variable('v'))) # tf.get_variable('v') 获取变量,因前面指定了计算图g1,这里会到g1中获取 # 在计算图g2 中读取变量 'v'的值,输出 with tf.Session(graph=g2) as sess: # 初始化 tf.global_variables_initializer().run() with tf.variable_scope('',reuse=True): # 根据计算图g2初始化的值输出,这行会输出[1.] print(sess.run(tf.get_variable('v')))
数据模型:张量
张量是TensorFlow中管理数据的形式。在TensorFlow程序中,所有的数据都是通过张量的形式来表示。
零阶张量表示标量(scalar),也就是一个数
一阶张量为向量(vector),也就是一个一维数组
第n阶张量可以理解为一个n 维数组
注意在TensorFlow中张量只是对运算结果的引用,不是直接采用数组的形式,在张量中没有真正的保存数字,它保存的是如何得到这些数字的计算过程
import tensorflow as tf # 几乎默认这种 a = tf.constant([1.0,2.0]) # 定义一个变量a,并初始化 b = tf.constant([3.0,4.0]) # 定义一个变量b ,并初始化 add = a + b # 定义计算 (这时并没有真正计算,只是定义了计算图逻辑) print(add) # 输出为 Tensor("add:0", shape=(2,), dtype=float32)
看这个输出:Tensor("add:0", shape=(2,), dtype=float32)
可以看出 add 在TensorFlow中是一个Tensor, 在TensorFlow计算的结果不是一个具体的数字,而是一个张量(Tensor)。一个Tensor中主要保存了3个属性: name,shape,type,(名字、维度结构、类型)
属性name是一个张量的唯一标识符(有重复会报异常),也给出了这个张量是如何计算出来的
其中add:0 说明了add这个张量是计算节点’add’输出的第一个结果(编号从0开始)
属性shape描述了张量的维度信息。shape=(2,)说明张量add是一个一维数组,数组的长度是2
属性type,是指张量的类型,每一个张量会有一个唯一的类型。类型不匹配时会报错
# 使用张量记录中间结果 a = tf.constant([1.0,2.0],name='a') # 定义一个变量a,并初始化 b = tf.constant([3.0,4.0],name='b') # 定义一个变量b ,并初始化 result = a + b # 直接计算向量的和,这样可读性会比较差 result = tf.constant([1.0,2.0],name='a') + tf.constant([3.0,4.0],name='b')
好吧,今天就先介绍这两个概念了,本来还准备了会话、变量、常量这些概念,再写就篇幅太长了点。索性就写短点吧,尽量发的勤快点,小步快跑~
最后,有问题欢迎沟通交流
参考资料
TensorFlow官网
实战Google深度学习框架
出自公众号“从机器学习到深度学习那些事”