第6章 运动预测和补偿(Motion Estimation and Compensation)

残留的块数据经过DCT,量子化,entropy coding 压缩成字符串用来存储或传送,其中很多部分能提高压缩度,比如在DCT中转换为波形平面对以后量子化过程提供一些必要的手段,人眼能敏感于低波产生的画面,可对高波产生的画面比较不敏感,这方面的知识请参考有关HVS的文献。可是这些国能都基础是原来数据的大小。那怎么样能把原来数据的大小变小呢?据我到现在学习过程中只有帧内预测和帧外预测,帧内预测诗利用已解码好的单位来预测下一个单位(这里指的单位是一个块),帧外预测是利用影像各个图片的相关性而决定的,比方说前一张和现在的frame有很大的相视性,我们可以利用这个关系来预测当前画面。下面图表示帧内预测和 帧外预测。

本章介绍帧外预测和方法。帧外预测可以很大程度的提高压缩率在图片压缩的第一个阶段。可是帧外预测的计算复杂度很高,我看了一些文章那里说复杂度站到整个encoding中的4-50%.所以可以说是压缩的能力取决于帧外预测的计算复杂度。那么决定视频编码能力的要素是以下几个方面。

1.编写代码的能力:怎么查找残留数据?

2.复杂度:算法充分利用已编写好的数据?

3.strorage或延迟:在硬件上有clock的延迟或者是在软件在数据延迟?

4.信息传送问题:帧外预测后产生的矢量要传送给encode吗?传送就用什么方式传送?

在我列出的问题以外还有很多问题,这个要在视频编码中一个个要处理的问题。在讨论问题当中一个就直接就简单的问题是,在压缩理论里你的计算量大就能压缩出很小的大小来,反面你的计算量不够复杂,这会引起很小的压缩比如lossless压缩方法。(压缩力有2中压缩方法一种是loss,另一种是lossless)。

那帧外预测的要求是什么呢?

帧内预测产生一个残留的数据经过参考已编码好的frame(reference frame)。这个frame可以是时间上的已经过的图片,或者是以后要播放的图片。设计的目的是让帧外预测有很高的准确度。经过帧外预测的数据要很小,最好是完全相似。这个取决于计算的复杂度。当一个图片进行帧外预测时他是把当前的frame减去reference frame 把得到的数据经过后面的几个步伐来得到最后的数据来传送。与此同时在encode里海惊醒decode的工作用来以后的帧外预测使用,因为在decode那一端没有原始数据只能依靠decode来的数据来重现画面。最好的压缩率取决于残留块的大小。

posted @ 2012-07-28 00:43  VP-至尊  阅读(251)  评论(0编辑  收藏  举报