checkpoint文件

tensorflow saver和checkpoint总结_gzj_1101的专栏-程序员宅基地_checkpoint 深度学习 - 程序员宅基地 (cxyzjd.com)

最近在做深度学习相关实验,经常要用到别人的预训练模型,有时候常常不知道怎么使用,因此这篇博客将专门做一个总结。

1 Tensorflow 模型文件

checkpoint
model.ckpt-200.data-00000-of-00001
model.ckpt-200.index
model.ckpt-200.meta

 

1.1 meta文件

model.ckpt-200.meta文件保存的是图结构,通俗地讲就是神经网络的网络结构。一般而言网络结构是不会发生改变,所以可以只保存一个就行了。我们可以使用下面的代码只在第一次保存meta文件。

saver.save(sess, 'my-model', global_step=step,write_meta_graph=False)

 

并且还可以使用tf.train.import_meta_graph(‘model.ckpt-200.meta’)能够导入图结构。

1.2 data文件

model.ckpt-200.data-00000-of-00001

 

数据文件,保存的是网络的权值,偏置,操作等等。

1.3 index文件

model.ckpt-200.index是一个不可变得字符串表,每一个键都是张量的名称,它的值是一个序列化的BundleEntryProto。 每个BundleEntryProto描述张量的元数据:“数据”文件中的哪个文件包含张量的内容,该文件的偏移量,校验和,一些辅助数据等等。

Note: 以前的版本中tensorflow的model只保存一个文件中。

2 保存和恢复Tensorflow模型

2.1 保存模型

tf.train.Saver 类别提供了保存和恢复模型的方法。tf.train.Saver 构造函数针对图中所有变量或指定列表的变量将 save 和 restore op 添加到图中。Saver 对象提供了运行这些 op 的方法,指定了写入或读取检查点文件的路径。
一般而言,如果不指定任何参数,tf.train.Saver会保存所有的参数。下面是一个简单的例子,来自TensorFlow官网

# Create some variables.
v1 = tf.get_variable("v1", shape=[3], initializer = tf.zeros_initializer)
v2 = tf.get_variable("v2", shape=[5], initializer = tf.zeros_initializer)

inc_v1 = v1.assign(v1+1)
dec_v2 = v2.assign(v2-1)

# Add an op to initialize the variables.
init_op = tf.global_variables_initializer()

# Add ops to save and restore all the variables.
saver = tf.train.Saver()

# Later, launch the model, initialize the variables, do some work, and save the
# variables to disk.
with tf.Session() as sess:
  sess.run(init_op)
  # Do some work with the model.
  inc_v1.op.run()
  dec_v2.op.run()
  # Save the variables to disk.
  save_path = saver.save(sess, "/tmp/model.ckpt")
  print("Model saved in path: %s" % save_path)

 

最后会将v1和v2以及op都保存下来。但是如果你只想保存v1和v2,你可以这样写。

tf.train.Saver(V1.values()+V2.values())

 

2.2 恢复模型

模型加载需要利用Saver.restore方法。可以加载固定参数,也可以加在所有参数。

saver.restore(sess,model_path)

 

具体的不一一介绍了,有兴趣的可以看一下参考的连接。

2.3 加载模型限制

pre-trained 模型常用来做迁移

参考资料

1.TensorFlow学习笔记(8)–网络模型的保存和读取

2.Tensorflow加载预训练模型和保存模型

3.TensorFlow, why there are 3 files after saving the model?

学习,但是却存在一个限制,那就是网络的前一层必须是一致的,以vgg16为例,如果你利用前面几层提取特征,前面几层的网络必须得和vgg保持一致。而后面的网络参数是随机初始化的。

posted on 2021-11-16 11:00  一杯明月  阅读(279)  评论(0编辑  收藏  举报