【TF-2-4】Tensorflow-模型和数据的保存和载入

一、基本方法

1.1 保存

定义变量
使用saver.save()方法保存

import tensorflow as tf
import numpy as np
W = tf.Variable([[1,1,1],[2,2,2]],dtype = tf.float32,name='w')
b = tf.Variable([[0,1,2]],dtype = tf.float32,name='b')

init = tf.initialize_all_variables()
saver = tf.train.Saver()
with tf.Session() as sess:
    sess.run(init)
    save_path = saver.save(sess,"save/model.ckpt")

1.2 载入

定义变量
使用saver.restore()方法载入

import tensorflow as tf
import numpy as np
W = tf.Variable(tf.truncated_normal(shape=(2,3)),dtype = tf.float32,name='w')
b = tf.Variable(tf.truncated_normal(shape=(1,3)),dtype = tf.float32,name='b')

saver = tf.train.Saver()
with tf.Session() as sess:
    saver.restore(sess,"save/model.ckpt")

1.3 说明

1）创建saver时，可以指定需要存储的tensor，如果没有指定，则全部保存；

2）默认情况下：saver.save(sess,"save/model.ckpt")产生4个文件：

checkpoint文件保存最新的模型；

model.ckpt.data 以字典的形式保存权重偏置项等训练参数

model.ckpt.index：存储训练好的参数索引

model.ckpt.meta : 元文件(meta) 中保存了MetaGraphDef 的持久化数据，即模型数据，计算图的网络结构信息，完整的graph、variables、operation、collection。

3）如何知道tensor的名字，最好是定义tensor的时候就指定名字，如上面代码中的name='w'，如果你没有定义name，tensorflow也会设置name，只不过这个name就是根据你的tensor或者操作的性质。所以最好还是自己定义好name。

【说明：这种方法不方便的在于，在使用模型的时候，必须把模型的结构重新定义一遍，然后载入对应名字的变量的值。但是很多时候我们都更希望能够读取一个文件然后就直接使用模型，而不是还要把模型重新定义一遍。所以就需要使用另一种方法。】

二、不需重新定义网络结构的方法

tf.train.import_meta_graph

import_meta_graph(

meta_graph_or_file,

clear_devices=False,

import_scope=None,

**kwargs

)

这个方法可以从文件中将保存的graph的所有节点加载到当前的default graph中，并返回一个saver。也就是说，我们在保存的时候，除了将变量的值保存下来，其实还有将对应graph中的各种节点保存下来，所以模型的结构也同样被保存下来了。

比如我们想要保存计算最后预测结果的y，则应该在训练阶段将它添加到collection中。具体代码如下：

2.1 保存

和1.1一样，保持不变

2.2 载入

import tensorflow as tf
import numpy as np
# W = tf.Variable(tf.truncated_normal(shape=(2,3)),dtype = tf.float32,name='w')
# b = tf.Variable(tf.truncated_normal(shape=(1,3)),dtype = tf.float32,name='b')

# saver = tf.train.Saver()
with tf.Session() as sess:
    new_saver = tf.train.import_meta_graph("save/model.ckpt.meta")
    new_saver.restore(sess, "save/model.ckpt")

【个人理解：model.ckpt.meta : 保存了TensorFlow计算图的网络结构信息，import_meta_graph("save/model.ckpt.meta")这句拉取了结构，故不用重新定义。】

三、saved_model方式

实现了 (y = x + b)当输入一个x 那么输出的结果y就等于输入x加上b。

3.1 保存

# Author:yifan
import os
import tensorflow as tf # 以下所有代码默认导入
from tensorflow.python.saved_model.signature_def_utils_impl import predict_signature_def
# 保存模型路径
PATH = './models'
# 创建一个变量
one = tf.Variable(3.0)
# 创建一个占位符,在 Tensorflow 中需要定义 placeholder 的 type ，一般为 float32 形式
num = tf.placeholder(tf.float32,name='input')
# 创建一个加法步骤,注意这里并没有直接计算
sum = tf.add(num,one,name='output')
# 初始化变量，如果定义Variable就必须初始化
init = tf.global_variables_initializer()
# 创建会话sess
with tf.Session() as sess:
	sess.run(init)
	print(sess.run(sum, feed_dict={num: 5.0}))
	# #保存SavedModel模型，使用以下三句
	builder = tf.saved_model.builder.SavedModelBuilder(PATH)
	signature = predict_signature_def(inputs={'input':num}, outputs={'output':sum})
	builder.add_meta_graph_and_variables(sess,[tf.saved_model.tag_constants.SERVING],signature_def_map={'predict': signature})
	builder.save()

说明：

tf.saved_model.builder.SavedModelBuilder：该方法的参数是传入用于保存模型的目录名，目录不用预先创建
predict_signature_def：将输入节点、输出节点和名字（sig_name）传入，生成一个签名对象。传入的参数为输入和输出以及他们的name。
add_meta_graph_and_variables：将签名加入到模型中
第一个参数传入的是Session它包含了当前graph(图)和Variables(变量)。
第二个参数是给当前需要保存的MetaGraph 一个标签，标签名可以自定义，在之后载入模型的时候，需要根据这个标签名去查找对应的MetaGraphDef，找不到就会报如 RuntimeError: MetaGraphDef associated with tags 'foo' could not be found in SavedModel这样的错。

---- 标签也可以选用系统定义好的参数，tf.saved_model.tag_constants.SERVING与 tf.saved_model.tag_constants.TRAINING等。

运行结果：8.0，和保存的模型：

执行完成后会在当前项目的目录下生成models文件夹，里面包含variables文件夹以及saved_model.pb文件。
variables保存所有变量信息，
saved_model.pb用于保存模型结构等信息，含图形结构。

注意：当前目录下不可以存在models文件夹，否则会报错。

3.2 载入

# Author:yifan
import tensorflow as tf # 以下所有代码默认导入
PATH = './models'
with tf.Session() as sess:
  tf.saved_model.loader.load(sess, ["serve"], PATH) 
#一种载入变量的方式：
  in_x =tf.saved_model.loader.load(sess, ["serve"], PATH).signature_def['predict'].inputs['input'].name
#另一种载入变量的方式：
# in_x = sess.graph.get_tensor_by_name('input:0')     #加载输入变量
  y = sess.graph.get_tensor_by_name('output:0')       #加载输出变量
  scores = sess.run(y, feed_dict={in_x: 3.})
  print(scores)

说明：

tf.saved_model.loader.load方法加载模型，第二个参数["serve"]为TAG标签与存模型时候指定的字段相同（tf.saved_model.tag_constants.SERVING = "serve"，本文中调用了tf的定义），第三个参数为模型路径；
tf.saved_model.loader.load(sess, ["serve"], PATH).signature_def['predict'].inputs['input'].name：用signature_def方法从导入的模型中提取签名。和3）作用是一样的。
sess.graph.get_tensor_by_name：加载输入输出变量，注意这里的变量name都需要加上":0"，如"input"变为"input:0"
最后像之前那样sess.run()，feed喂入数据，这里输入了个3.0。

结果：6.0

3.3 查看模型的Signature签名

传统的导入需要用get_tensor_by_name ，这样就需要记录tensor的name熟悉，很麻烦。通过signature，我们可以指定变量的别名，方便存取。但如果我们拿到了别人的含有signature一个SavedModel模型而且并不知道"标签"那么怎么调用呢？

---Tensorflow官方已经为我们准备好了一个脚本，tensorflow下的saved_model_cli.py文件可以帮到。

我们可以'WIN+R'输入'cmd'然后回车打开你的CMD，然后指定路径到你的模型目录下，运行：

saved_model_cli show --dir=./ --all

打印出的信息中我们就可以看到模型的输入/输出的名称、数据类型、shape以及方法名称。

附件一：sklearn上的用法

保存参数：

from sklearn.externals import joblib

joblib.dump((centres, des_list,img_features), "imgs_features.pkl", compress=3)

读取参数：

centres, des_list, img_features = joblib.load("imgs_features.pkl") #读取保存的特征

参考文章

【1】 https://blog.csdn.net/thriving_fcl/article/details/71423039

【2】 https://blog.csdn.net/liuxiao214/article/details/79048136

【3】 https://blog.csdn.net/thriving_fcl/article/details/75213361

【4】 https://blog.csdn.net/weixin_43215867/article/details/85038313

posted @ 2020-06-25 10:53 忆凡人生阅读(2936) 评论(2) 编辑收藏举报

刷新页面返回顶部

yifanhunter