Paper | A novel deep learning-based method of improving coding efficiency from the decoder-end for HEVC
A novel deep learning-based method of improving coding efficiency from the decoder-end for HEVC
发表在2017年DCC。
这篇文章立意很简单,方法也很简单,但是做得早、效果好、引用量也不错(40+)。
指标:在HEVC的intra、LDP、LDB和RA模式下,BDBR平均可以下降5%、6.4%、5.3%和5.5%。
由于是解码端(decoder-end)的网络,因此可以进一步解决inloop-filter没能解决的块效应和振铃效应等压缩伪影。
以下摘一些精彩的叙述,同时重点看清楚实施细节。
精彩叙述
-
提升压缩质量是视频编码的永恒主题。然而,无论我们如何修改编码器,视频冗余已经很难下降。
-
在解码端增强视频质量,等价于提升了压缩效率。
-
这种方法受益于端到端训练,并且可以拓展至视频压缩标准。
-
由于实际的有损压缩标准都不是理论最优的,因此就存在信息冗余可以被继续挖掘和利用。
-
JPEG、H264、HEVC等方法之所以没能突破压缩率极限,就是因为它们没有利用外部信息或先验。
-
我们无需修改编码器。
-
作者将那些传统的优化方法称为compressive-sensing-based methods。它们通常不考虑外部先验,但仍然能取得一定效果,说明冗余仍然是存在的。
细节
DCAD:Deep CNN-based Auto Decoder。
-
训练目标:MSE损失。
-
网络结构:10层\(64 \times 3 \times 3\)滤波器堆叠,ReLU激活函数(除了最后一层),全局残差网络,各层补零。
-
作者试过20层,效果并没有更好。
-
在选择训练块时,作者是根据TU分割信息选择的。作者尽量使得每一种TU分割的数量相同,即均匀出现在训练集中。
-
对于高QP模型,作者将低QP模型迁移过来,以更好地学习。
-
图像为YCbCr三通道,只在亮度通道上增强。
-
HM 16.0压缩,考虑了QP = 22,27,32,37。
-
AdaDelta优化方法比学习率衰减方法更好。关于四个QP的初始学习率分别设为1,0.1,0.1和0.01。
-
最后一层的学习率是全局的1/10。