TensorFlow深度学习入门笔记(二)基本概念与代码1

关注公众号“从机器学习到深度学习那些事”获取更多最新资料

写在前面

学习建议:以下学习过程中有不理解可以简单查找下资料,但不必纠结(比如非得深究某一个函数等),尽量快速的学一遍,不求甚解无妨。因为有些知识现在陌生,可能学到后面就发现之前的问题都很自然的理解与会用了。多实操代码,不能只复制代码,或者感觉懂了就只看。熟能生巧,我亦无他,唯手熟尔

计算模型:计算图

计算图是TensorFlow中最基本的一个概念,TensorFlow中所有的计算都会被转化为计算图上的节点。TensorFlow名字中的tensor即张量,可以理解为多维数组。tensor表明了TensorFlow的数据结构,即它处理的都是一个个tensor,flow-流体现的是TensorFlow的计算模型。张量这定义的模型中流动,转化成不同的tensor,最终完成任务。

TensorFlow也是一种懒操作,即先画图,并没有真正的开始计算,只是定义了各个计算节点,定义了计算逻辑,只有最终调用run()时才会真正开始计算,有点像scala的模式。TensorFlow中的每一个计算都是计算图中的一个节点,而节点之间的边描述了计算之间的依赖关系(计算逻辑)。

具体的计算网络结构,可以通过TensorFlow中专门的可视化工具TensorBoard画出来。TensorBoard后面会专门讲。

TensorFlow程序分为两个阶段,一是定义计算(图的形成),二是执行计算(run)

先看一段代码,我尽量把注释写满点,开始接触不懂没关系,先跟着套路走,本地跑下代码

代码

import tensorflow as tf # 几乎默认这种,咱也不免俗

a = tf.constant([1.0,2.0]) # 定义一个变量a,并初始化
b = tf.constant([3.0,4.0]) # 定义一个变量b ,并初始化
add = a + b # 定义计算 (这时并没有真正计算,只是定义了计算图逻辑)
print(add) # 打印出 add 从结果看(输出  Tensor("add:0", shape=(2,), dtype=float32)),这也只是一种定义没有真正计算出a+b的结果,
# 三个节点 a , b , add 。注意这里没有显式的指定计算图(tf.Graph),则会通过tf.get_default_graph()获取默认的计算图

print(a.graph is tf.get_default_graph())
# 输出 True
# 补充:初学时总是混淆这两个函数tf.multiply()与tf.matmul(),在这里记录下
# tensoflow 中tf.multiply(a,b)与tf.matmul(c,d)比较
a = tf.constant([1.0,2.0]) # 定义一个变量a,并初始化
b = tf.constant([3.0,4.0]) # 定义一个变量b ,并初始化

c = tf.constant([1, 2, 3, 4, 5, 6], shape=[2, 3])
d = tf.constant([7, 8, 9, 10, 11, 12], shape=[3, 2]) # 定义一个变量d ,并初始化
product1 = tf.multiply(a,b) # 对应位置相乘
product2 = tf.matmul(c,d) # 矩阵的乘法,得到的结果是一个矩阵,行乘列作为对应位置的元素

with tf.Session() as sess:
   print(sess.run(product1))
   print(sess.run(product2))

 

再来一段在不同计算图中的例子

# 下面定义不同的计算图,并执行计算
import tensorflow as tf

g1 = tf.Graph()
with g1.as_default():
   # 在计算图g1中定义变量v,并初始化为0
   v = tf.get_variable('v', shape=[1], initializer=tf.zeros_initializer())
   # # 初始化为常数
   # v = tf.get_variable('v',initializer=tf.constant([2.0,3.1]))

g2 = tf.Graph()
with g2.as_default():
   # 在计算图g2中定义变量v,并初始化为1
   v = tf.get_variable('v', shape=[1], initializer=tf.ones_initializer())

# 在计算图g1 中读取变量 'v'的值,输出
with tf.Session(graph=g1) as sess:  # 这种也几乎是默认,参考官网
   # TensorFlow中,run之前需要先初始化
   tf.global_variables_initializer().run()
   with tf.variable_scope('',reuse=True):
       # 根据计算图g1初始化的值输出
       print(sess.run(tf.get_variable('v')))
       # tf.get_variable('v') 获取变量,因前面指定了计算图g1,这里会到g1中获取

# 在计算图g2 中读取变量 'v'的值,输出
with tf.Session(graph=g2) as sess:
   # 初始化
   tf.global_variables_initializer().run()
   with tf.variable_scope('',reuse=True):
       # 根据计算图g2初始化的值输出,这行会输出[1.]
       print(sess.run(tf.get_variable('v')))

 

数据模型:张量

张量是TensorFlow中管理数据的形式。在TensorFlow程序中,所有的数据都是通过张量的形式来表示。

零阶张量表示标量(scalar),也就是一个数

一阶张量为向量(vector),也就是一个一维数组

第n阶张量可以理解为一个n 维数组

注意在TensorFlow中张量只是对运算结果的引用,不是直接采用数组的形式,在张量中没有真正的保存数字,它保存的是如何得到这些数字的计算过程

import tensorflow as tf # 几乎默认这种

a = tf.constant([1.0,2.0]) # 定义一个变量a,并初始化
b = tf.constant([3.0,4.0]) # 定义一个变量b ,并初始化
add = a + b # 定义计算 (这时并没有真正计算,只是定义了计算图逻辑)
print(add) 
# 输出为 Tensor("add:0", shape=(2,), dtype=float32)

 

看这个输出:Tensor("add:0", shape=(2,), dtype=float32)

可以看出 add 在TensorFlow中是一个Tensor, 在TensorFlow计算的结果不是一个具体的数字,而是一个张量(Tensor)。一个Tensor中主要保存了3个属性: name,shape,type,(名字、维度结构、类型)

属性name是一个张量的唯一标识符(有重复会报异常),也给出了这个张量是如何计算出来的

其中add:0 说明了add这个张量是计算节点’add’输出的第一个结果(编号从0开始)

属性shape描述了张量的维度信息。shape=(2,)说明张量add是一个一维数组,数组的长度是2

属性type,是指张量的类型,每一个张量会有一个唯一的类型。类型不匹配时会报错

# 使用张量记录中间结果
a = tf.constant([1.0,2.0],name='a') # 定义一个变量a,并初始化
b = tf.constant([3.0,4.0],name='b') # 定义一个变量b ,并初始化
result = a + b 
# 直接计算向量的和,这样可读性会比较差
result = tf.constant([1.0,2.0],name='a') + tf.constant([3.0,4.0],name='b')

 

好吧,今天就先介绍这两个概念了,本来还准备了会话、变量、常量这些概念,再写就篇幅太长了点。索性就写短点吧,尽量发的勤快点,小步快跑~

最后,有问题欢迎沟通交流

参考资料

TensorFlow官网

实战Google深度学习框架

出自公众号“从机器学习到深度学习那些事”

posted @ 2019-02-22 12:18  一颗爱学习的花菜  阅读(313)  评论(0编辑  收藏  举报