振铃效应

在媒体处理过程中我们常常会碰到图像和声音振铃效应,图像振铃效应如下图。

 

 

  

TI netra 平台也提供了DRN(Used for removing De-Ringing artifacts)模块。了解De-Ringing,有助于我们提升音视频质量。

在高清视频中人在走动过程会在白墙背景上留有类似水波纹的残影。加大会议码率也不能消除这个现象,过平台有残影,点对点也有残影,友商过来的码流也有这个现像。

经过分析,水波纹的残影就是振铃效应。

1.1 振铃效应

在信号处理中,振铃效应是一种出现在信号快速转换时,附加在转换边缘上导致失真的信号。而在图像或影像上,振铃效应会导致出现在边缘附近的环带或像是"鬼影"的环状伪影;在音频中,振铃效应会导致出现在短暂音附近的回声,特别是由打击乐器发出的声音;最容易注意到的是预回声。使用"振铃"这一个词则是因为输出信号在输入信号快速转换的边缘附近出现一有一定衰减速度的震荡,这个现象相似于钟被敲击之后发出声音的过程。

1.2 造成振铃的原因

在时域上,产生振铃效应的原因则是因为Sinc函数中的涟波,即为一个完美低通滤波器的脉冲响应(在时域中的形式)。在数学上这叫做吉布斯现象

吉布斯现象(Gibbs phenomenon),由Henry Wilbraham1848年最先提出,并由约西亚·吉布斯于1899年证明。在工程应用时常用有限正弦项正弦波叠加逼近原周期信号。所用的谐波次数N的大小决定逼近原波形的程度,N增加,逼近的精度不断改善。但是由于对于具有不连续点的周期信号会发生一种现象:当选取的傅里叶级数的项数N增加时,合成的波形虽然更逼近原函数,但在不连续点附近会出现一个固定高度的过冲,N越大,过冲的最大值越靠近不连续点,但其峰值并不下降,而是大约等于原函数在不连续点处跳变值的9%,且在不连续点两侧呈现衰减振荡的形式。

 

 

 

 

 

 

 

 

    当信号转换速度加剧的时候,我们可以在振铃中区别出过冲(和下冲),过冲时输出信号较输入讯号高,而在过冲之后,信号因为过度修正而变得低于目标数值,之后来回震荡;这些现象往往会同时发生,因此常常被混用,而被共同称为"振铃"

从图像DCT函数来看,一条像素线代表了一个采样的波形,因此,一个具有锐利的黑/白边缘的块将类似于一个只有最小和最大采样值组成的方波。

 

DCT量化会扭曲波形。失真通常有一个波浪形状,增加一些值,减少一些值。图像中,蓝色为过冲,红色为下冲。

 

图像解码器会对数据做过冲保护,将波形剪辑到允许的数值范围内(YUV 8位输出中为0-255)。剪切后超调值被压平(<0替换为0,>255替换为255),所以只有下次失真仍然可见,解码后还是会产生振铃现像。

 

 

 

 

目前主流视频编码使用8×8或16×16的区块,并对其中的每一个区块使用离散余弦变换(DCT)。DCT是一种和傅立叶变换相关的变换,而振铃效应的发生是因为损失了高频的信号成分或是高频成分的精确度有所损失。

 

1.3 De-ringing

    

常用去振铃的方法有量子化前改变波形:将最小值和最小值扩展到超值(其他保持不变)。

 

 

 

 

 修改后的波形振幅较大,经过编码器压缩后,畸变更有可能保持在超调范围内,视频解码器完成的剪辑将使所有超调区域变平,从而隐藏所有振铃失真。   

1.4 会议系统中的振铃效应

综上,会议系统中产生振铃效应一般产生在两个地方。

  1. 图像的前后处理。如在做图像滤波(缩放也可看做是一种滤波)和图像增强(边缘增强,图像去噪)时。
  2. 图像编码时。在亮度对比差很大时更容易产生。

    去振铃处理是需要运算资源的,现代编码器都会把去振铃处理放在内部。而在图像前后处理过程中有的系统会开放去振铃的API接口,用户自己根据资源的情况来判断是否启动DRN(Used for removing De-Ringing artifacts)模块。

总结

振铃效应在视频通信中是容易出现的一种现象,通过了解振铃效应,我们选取滤波器和编码器时要尽量避免它。

posted @ 2020-01-19 17:37  鹏小鹕  阅读(10389)  评论(0编辑  收藏  举报