摘要:
介绍一下最近看的一种通用卷积核用于模型压缩的方法,刚刚查了一下,原作者的博客在https://zhuanlan.zhihu.com/p/82710870 有介绍,论文传送门 https://papers.nips.cc/paper/7433-learning-versatile-filters-fo 阅读全文
摘要:
https://software.intel.com/zh-cn/articles/checkerboard-rendering-for-real-time-upscaling-on-intel-integrated-graphics 关于棋盘格渲染,以上这篇英特尔文章讲的挺清楚的,我这里只是简单c 阅读全文
摘要:
今天在用openvino将pb文件转成ir文件的时候,遇到了一个小问题,记录下来分享给需要的人。 我用tensorflow自己存了个pb文件,具体的方法是在session中加入如下的语句 然后把这个生成的inference_graph.pb文件用mo.py转成openvino识别的.xml和.bin 阅读全文
摘要:
ESPCN是twitter2017年提出来的实时视频超分辨率的方法。下面记录下对论文的一些理解。 上面这张图就是整个网络的架构。输入t帧的相邻图像,t-1和t+1,在具体的网络中,有输入连续3张,5张,7张和9张的,在论文中有分析这个对具体效果的影响,这边是以3张为例。逐像素计算t-1和t帧的lr的 阅读全文
摘要:
理论 在混合精度训练中,权重,激活值和梯度是保存成fp16的形式,为了能够匹配fp32的网络精度,有一个权重的fp32的master copy。 在tensorflow中的具体实现 tensorflow支持fp16的存储和tensor计算。包含tf.float16的数据类型的卷积和矩阵运算会自动使用 阅读全文
摘要:
openvino是一款可以在Intel CPU/GPU/FPGA/Movidious上进行神经网络加速的软件。官方安装流程见 https://software.intel.com/en-us/openvino-toolkit 。 But在安装的过程中踩了不少坑,下面记录一下,主要是在Windows下 阅读全文
摘要:
在网络训练中,发现生成的图像不对劲,如下面左图所示,文字完全不对。后来发现,是因为在python中把float类型的变量直接转成uint8的时候,负数部分就变成了极大的整数,变成了图中的白点。应该是采用截断的方法,把小于0大于255的都截断,然后再转换成uint8。得到的结果如右图所示。 一段验证性 阅读全文
摘要:
在基于CNN的超分辨率中,经常在最后一层使用stride>1的deconv layer,而这会造成棋盘格噪声。如下图所示 具体产生原因 上面的黑格子是表示原始图像中的某一个像素点,白色的表示转置卷积中的stride,一般是用0去填充。下面一层就是deconv生成的图像。可以看到stride不能整除s 阅读全文
摘要:
2022.5.8最近温习了一下BN,把更白话的一些想法记录下来。 Batch Normalization带来的好处 更容易训练,对初始值更不敏感但是这些是normalization带来的好处,不是batch带来了事实上,batch带来了很多的坏处,最大的坏处就是他的均值和方差在训练的时候是在一个ba 阅读全文
摘要:
恢复内容开始 ffmpeg是一个强大的工具,在工作中各种格式转换,编码,提取视频中的帧需要用到,记录下工作中常用的一些ffmpeg命令,持续更新中... 将输入的infile视频文件通过avc编码成h264的视频流 -i input file -an disable audio -vcodec 指定 阅读全文