转:UMHexagonS算法优化
网上找到的一个对UMHexagonS算法的优化。 前面是作者的答辩PPT,后面是作者发表的论文PDF。
题目:基于H.264/AVC视频编码运动估计算法的优化
1. 编码发展简史
- 1984年CCITT发布了H.120(数字基群电视会议编码标准)建议.
- 1988年CCITT通过了"px64Kbps(p = 1,2,3,,,,30)"视频编码标准H.261建议,被成为视频压缩编码的一个里程碑.
- 1986年,ISO和CCITT成立了联合图象专家组(JPEG, Joint Photographic Experts Group),1992年通过了JPEG标准.
- 1998年ISO/IEC成立了活动图象专家组(MPEG,Moving Picture Experts Group).
- 1991年公布了MPEG-1标准,码率为1.5Mbps,主要应用于家用VCD的视频压缩.
- 1994年公布了MPEG-2标准,用于DVB、DVD、HDTV.码率从4Mbps 、15Mbps….直到100Mbps分别用于不同档次和不同级别的视频压缩中.
- 1995年,ITU-T推出H.263标准,用于低于64Kbps的低码率视频传输.
- 1998年和2000年又分别公布了H.263+和H.263++等标准.
- 1999年,ISO/IEC通过了MPEG4,它除了定义视频压缩标准为,还强调了多媒体通信的交互性和灵活性.
- 2003年3月, ITU-T和ISO/IEC公布了H.264视频压缩标准,不仅显著提高了压缩比,而且具有良好的网络亲和性,加强了对IP网、移动网的误码和丢包的处理.有人将H.264成为新一代的视频编码标准
2. H.264的性能优势和计算复杂度
H.264的视频编码层采用了多种新技术,在相同的图像质量下,H.264所需码率约为MPEG-2的36%、H.263的51%、MPEG-4的61%,极大的提高了压缩率,保证了图象质量。
研究表明:
H.264编码器由于采用了高精度运动矢量(Motion vector),计算量迅速增长,运动估计消耗整个编码80%左右时间,严重降低了编码的实时性。
因此,研究基于H.264的运动估计(Motion Estimation )快速算法,是H.264标准走向实时应用的关键,也是本文研究的重点。
3. H.264/AVC编码器原理(图像的冗余)
视频序列图像在时间上存在很强的相关性,采用运动估计和运动补偿技术可以消除时间冗余以提高编码效率,这种技术广泛用于视频压缩的一些国际标准中,如H.261/263/264、MPEG-1/2/4。
4. H.264/AVC编码器原理(运动估计的定义)
经典的运动估计算法
5. H.264/AVC编码器原理(运动估计的基本思想 )
6. H.264/AVC编码器原理(UMHS算法)
UMHS算法(本文研究的快速运动估计算法)
UMHS算法全名叫"非对称十字型多层次六边形格点搜索算法"(Unsymmetrieal-CrossMuti-HexagonSeareh,UMHS).
算法特点:可以在很大程度上提高预测的有效性和鲁棒性 ,相对于H.264中原有的快速全搜索算法可节约90% 搜索时间.
7. UMHS算法描述及可优化点分析
具体搜索方法的步骤:
Step1:起始搜索点搜索(中值预测)
Step2:不对称的十字交叉搜索
Step3:非均匀多层次六边形格点搜索
Step3-1:小矩形窗口全搜索
Step3-2:扩展的多层次六边形16格点
Step4:扩展的六边形搜索
Step4-1:六边形模式搜索
Step4-2:基于小六边形(菱形)模式搜索
(1)算法起始搜索点位置如何确立?
(2)参考搜索窗口多大?
(3)能否缩定搜索象限?
(4)小六边形(菱形)搜索点数目是否可以减少?
8. 软件实现流程
9. 实验结果与性能分析
(1)主观评定
(2)客观评定
(3)测试平台及配置
(4)客观分析
(5)主观评价
10. 结论
实验结果表明:
与原UMHS搜索算法相比,优化后算法的优势还是很明显的 ,从客观视频质量评估标准来看,节省了运动估计(ME)时间(平均18.102%),在保证视频性能相对高的前提下,大大降低了运算复杂度,提高了编码速度。从主观评价标准来看,算法在提高了编码速度的同时,可以较好地保持原有的率失真特性。
综合评价指标:
(1)图象质量高(PSNR大)
(2)编码(运动估计)时间短(实时性好)
(3)码率低(压缩比大,方便存储和传输)
11. 下一步计划
(1)研究帧内模式选择、码率控制、熵编码等方面的优化方法
(2)以H.264扩展档次和主要档次为研究重点,分析编码器中涉及到的主要技术,如加权预测、SP帧与SI帧的编解码过程等等。
(3)基于DSP的编解码软件实现. 在熟悉一款DSP(Ti C6000系列)芯片硬件架构和开发环境(CCS3.3)的基础上,完成H.264编解码器代码的移植和优化,即研究如何在DSP上实现H.264的实时编解码技术.