深度学习模型的可视化技术总结(转)

 

深度学习模型的可视化技术总结(转)

可视化技术总结

关键字 :Visualizing intermediate convnet outputs ,Deep Visulization Tools

卷积神经网络的可视化方法可以分为两种方式:

  1. 保存训练后的权重等个训练参数的value以后,即借助绘图工具可视化,
  2. 借助深度学习的可视化的工具也能实现可视化. 比如tensorflow下面的tensorBorad; PyTorch下面的tensorBoradX, Matlab的Deep Visulization Toolbox, 借助绘图工具可视化

1. 借助绘图工具可视化

这个论坛的帖子一定要看 
这篇帖子给出了绘制图片的方法,写的很不错,还是有很多地方还需要修改,比如: 保存数据的save()方法有待修改, 图片的显示过程应该是在训练完毕之后,对模型恢复的时候进行的,而不应该把训练代码和可视化代码放在一起等等. 
tensorflow的计算过程都是以tensor的形式输出的, 需要想本法从tensor转换成np.ndarray类型, 然后再使用 openCV,pandas,matplotlib等绘图工具库来绘制图像.

将tensor–>np.ndarray只需调用sess.run(tensor)即可; 
接下来是使用绘图工具绘制图片了, 
plt提供了对矩阵的绘制绘制方法: plt.matshow()函数, 该函数可以可以将numpy的矩阵作为输入参数,并绘制出来. 简而言之. 就是可以把训练以后的tensor以图片的方式显示出来.

1.1 如何可视化特征图?

假如,以nmnist的数据为例;输入的tensor的大小是(1,28,28,64); 这属于tensorflow的基本输入格式(numbers, height,width,channels)

卷积以后会有64张特征图,大小是28*28; 
第一张图片的特征图应该为:[0,:,:,1], 第二张特征图是[0,:,:,2],以此类推

每张特征图的显示方式如下:

print ("Size of 'conv2' is %s" % (conv2.shape,))
# 输出结果为:Size of 'conv2' is (1, 28, 28, 64)

# 绘制每张特征图,迭代64次
for i in range(64):
    plt.matshow(conv2[0, :, :, i], cmap=plt.get_cmap('gray'))
    plt.title(str(i) + "th conv2") # 添加标题
    plt.colorbar() # 添加条码框
    plt.show() # 显示图片
    plt.save('路径') # 保存图片
  • 原始图片

这里写图片描述

这里写图片描述

1.2 如何可视化 kernel?

卷积核在很多深度学习框架中通常也是以tensor的形式存在,所以在显示的方式上并没有太大的区别; 
对tensorflow来说, 获取权重值还需要通过上下文的session.run方法才能获得

# 可视化 weights
wc1 = sess.run(weights['wc1']) # 
print ("Size of 'wc1' is %s" % (wc1.shape,))
# 绘制
for i in range(3):
    plt.matshow(wc1[:, :, 0, i], cmap=plt.get_cmap('gray'))
    plt.title(str(i) + "th conv filter")
    plt.colorbar()
    plt.show() 

这里写图片描述

这里写图片描述

2. 借助深度学习工具

A. Tensorflow

TensorFlow中的可视化方法是通过tensorBoard、tf.summary和tf.summary.FileWriter这三个模块相互合作来完成的。 
tf.summary中提供了在训练过程中记录每次训练数据的函数, 
tf.summary.FileWriter可以把所有tf.summary的记录保存到本地 
tensorBoard 用来渲染记录数据,并用浏览器的方式查看图片

可以根据tensorflow 的官网文档写出来,再次不赘述, tensorflow也有详细的官方文档,见索引[11] TensorBoard: Visualizing Learning

借助tensorflow的可视化工具实现可视化,可以分为以下5步: 
1. 声明数据的变量, 
2. 使用tf.summary()记录变量 
3. 使用 tf.summary.merge_all()合并所有的图 
4. 使用tf.summary.FileWriter保存数据 
5. tensorBoard浏览记录

step 1. 指定绘制的变量名称:

指定变量名称的方式有两种: 
(1) 使用tf.variable_scope()指定名称 
(2) 在创建name变量的时候,传入name参数 
具体使用方式如下: 
(1) 使用tf.variable_scope()指定名称的方式:


   with tf.variable_scope('conv1') as scope:
             # 变量的声明代码

(2) 在创建name变量的时候,传入name参数的方式: 
在tensorflow中,可以为每一个操作和tensor设置名称

var = tf.get_variable(name, shape, initializer=initializer)
weight_decay = tf.multiply(x=tf.nn.l2_loss(var), y=wd, name='weight_loss')

Step 2. 记录变量:

为变量起名字以后, tensorflow会默认记录weight/biases的每次变化, 并在后期绘制成曲线图.;除此以外如果需要记录其他参数的变化, tf.summary.提供了histogram()scalar(),image()用来记录变量

tf.summary.scalar()

tf.summary.scalar() 主要用于描绘画loss曲线和accuary曲线时会用到. 
函数说明: 
scalar(name, tensor, collections=None, family=None) 
name: 给节点起名字, 所起的名字会作为图片的名称 
tensor: 要记录的变量 
使用方法: 
python 
tf.summary.scalar('stddev/'+name,stddev) 

效果图:

这里写图片描述

tf.summary.histogram

一般是用来显示训练过程中变量的分布情况 
histogram(name, values, collections=None, family=None) 
函数说明: 
name: 给节点起名字, 所起的名字会作为图片的名称 
tensor: 要记录的变量 
使用方法:

tf.summary.histogram(var.op.name + '/gradients', grad)
tf.summary.histogram(tensor_name + '/activations', x)

效果图:

这里写图片描述

tf.summary.image

一般是对矩阵可视化, 可以可视化特征图和权重. 将【计算图】中的【图像数据】写入TensorFlow中的【日志文件】,以便为将来tensorboard的可视化做准备 
tf.summary.image(name,tensor, max_outputs=3, collections=None, family=None) : 
函数说明: 
tensor的格式应该是[batch_size, height, width, channels],并且数据类型必须为uint8,即所有的像素值在0~255 
此方法不仅可以绘制图像, 还可以绘制权重和特征图 
使用方法:

101 tf.summary.image('images',images)
....
172     for i in range(64):
173         tf.summary.image('conv1-feature',tf.slice(conv1,[0,0,0,i],[-1,-1,-1,1]))
174         tf.summary.image('conv-kernal',tf.slice(kernel,[0,0,0,i],[-1,-1,-1,1]))

效果图:

这里写图片描述

这里写图片描述

step 4. 记录像数据

注意, 在sess.run()之前, 以上的操作仅仅是定义 . 并没执行. 
在执行之前, 需要把所有的图合并在一起, 调用tf.summary.merge_all()可以实现. 
再次注意, 这里需要在每次训练迭代的时候,通过sess.run()的方式调用.每调用一次,会把当前的数据记录下来.

summary_op = tf.summary.merge_all()

for i in range(epochs):
     xxxxxx
     sess.run(summary_op)

step 5. 保存数据

这一步最为关键, 关系到数据是否能够记录并且保存下来

 summary_writer = tf.summary.FileWriter(FLAGS.train_dir,graph_def=sess.graph_def)
 ...
 # 在训练过程中调用:
for step in xrange(FLAGS.max_steps):
         .... 

      if step % 100 == 0:
        summary_str = sess.run(summary_op) # 记录数据
        summary_writer.add_summary(summary_str, step) # 保存绘图数据
      # Save the model checkpoint periodically.
      if step % 1000 == 0 or (step + 1) == FLAGS.max_steps: #保存训练数据
        checkpoint_path = os.path.join(FLAGS.train_dir, 'model.ckpt')
        saver.save(sess, checkpoint_path, global_step=step) # saver

        ....

Step6. tensorborad渲染

待模型训练结束,可以通过tensorborad --logdir '<保存的路径>'就可以查看可视化后的数据. 更多呢详细参数通过 tensorborad --lhelp可以获得.

B keras

How convolutional neural networks see the world

问题集合 
RuntimeError: Invalid DISPLAY variable

3参考文献

[1] tensorflowtutorials卷积神经网络可视化 
[2] 卷积神经网络实战(可视化部分)——使用keras识别猫咪 (英文部分) 
[3] 用TensorFlow可视化卷积层的方法 
[4] Visualizing parts of Convolutional Neural Networks using Keras and Cats 
[5] Visualizing CNN filters with keras 
[6] Keras: visualizing the output of an intermediate layer 
[7] pytorch-cnn-visualizations 
[8] Deep Visualization:可视化并理解CNN 
[9] Visualizing and Understanding Convolutional Networks 
[10]Matplotlib imshow/matshow display values on plot 
[11] TensorBoard: Visualizing Learning 
[12] 【Tensorflow_DL_Note17】TensorFlow可视化学习4_tf.summary模块的详解

posted @ 2019-05-15 08:58  大汤姆  阅读(296)  评论(0编辑  收藏  举报