Paper | A novel deep learning-based method of improving coding efficiency from the decoder-end for HEVC

A novel deep learning-based method of improving coding efficiency from the decoder-end for HEVC

A novel deep learning-based method of improving coding efficiency from the decoder-end for HEVC
- 精彩叙述
- 细节

发表在2017年DCC。

这篇文章立意很简单，方法也很简单，但是做得早、效果好、引用量也不错（40+）。

指标：在HEVC的intra、LDP、LDB和RA模式下，BDBR平均可以下降5%、6.4%、5.3%和5.5%。
由于是解码端（decoder-end）的网络，因此可以进一步解决inloop-filter没能解决的块效应和振铃效应等压缩伪影。

以下摘一些精彩的叙述，同时重点看清楚实施细节。

精彩叙述

提升压缩质量是视频编码的永恒主题。然而，无论我们如何修改编码器，视频冗余已经很难下降。
在解码端增强视频质量，等价于提升了压缩效率。
这种方法受益于端到端训练，并且可以拓展至视频压缩标准。
由于实际的有损压缩标准都不是理论最优的，因此就存在信息冗余可以被继续挖掘和利用。
JPEG、H264、HEVC等方法之所以没能突破压缩率极限，就是因为它们没有利用外部信息或先验。
我们无需修改编码器。
作者将那些传统的优化方法称为compressive-sensing-based methods。它们通常不考虑外部先验，但仍然能取得一定效果，说明冗余仍然是存在的。

细节

DCAD：Deep CNN-based Auto Decoder。

DCAD

训练目标：MSE损失。
网络结构：10层\(64 \times 3 \times 3\)滤波器堆叠，ReLU激活函数（除了最后一层），全局残差网络，各层补零。
作者试过20层，效果并没有更好。
在选择训练块时，作者是根据TU分割信息选择的。作者尽量使得每一种TU分割的数量相同，即均匀出现在训练集中。
对于高QP模型，作者将低QP模型迁移过来，以更好地学习。
图像为YCbCr三通道，只在亮度通道上增强。
HM 16.0压缩，考虑了QP = 22，27，32，37。
AdaDelta优化方法比学习率衰减方法更好。关于四个QP的初始学习率分别设为1，0.1，0.1和0.01。
最后一层的学习率是全局的1/10。

posted @ 2019-10-20 19:39 RyanXing 阅读(704) 评论(0) 收藏举报

刷新页面返回顶部