Paper | A Pseudo-Blind Convolutional Neural Network for the Reduction of Compression Artifacts

总结

问题：HEVC压缩视频的盲恢复。

背景：

当前方法都需已知量化参数QP，intra/inter coding，prediction unit sizes，deblocking filter on/off等。
作者认为，盲QP系统比非盲QP系统更实际，并且非盲系统的QP未必能真实反应图像质量。因此盲QP是必要的。
作者认为HEVC要比JPEG更复杂，不能套用JPEG方法。

解决方法：一个QP判决器，级联上四个并联的网络，每个网络服务1个QP。

评价：

首先介绍非盲的图像恢复网络IACNN。整体上看：

网络整体

局部的Inception module：

Inception module

作者对AVC考虑了5个QP：34、37、42、47、51，对MPEG-2和HEVC考虑了4个QP。即，整体框架中将有4/5个IACNN。

这是一个19层、\(3 \times 3\)卷积的VGG网络，参数量高达5.8M。

作者先将图像分为块（patch），然后根据块的判决结果来决定该图像的QP。

训练时注意两点：

（1）我们不使用平滑区域的块，原因是：这些块的判决结果与QP几乎无关（任意QP，其结果几乎是一样的）。因此我们考虑具有丰富纹理的块，即具有较大方差（边缘和纹理）的块。

（2）连续帧可能有多个相似的块。为了避免冗余，我们隔50帧取一帧。

测试时注意三点：

（1）同样要选取方差较大（纹理较丰富）的块。

（2）对于JPEG等图像恢复任务，我们少数服从多数即可。对于视频恢复任务，为保证时序连续性，我们要让一个邻域内的所有帧都参与投票，附加权值。

（3）当邻域帧结果差异过大时，作者采用邻域为3的检测区间，避免场景切换的影响。【个人保持怀疑态度】

最终大网络就是这个样子，很简单都不需要多解释：

我们只看分类器的准确率：

posted @ 2019-10-19 12:05 RyanXing 阅读(521) 评论(0) 收藏举报

刷新页面返回顶部