http://zh.wikipedia.org/wiki/MPEG-2
MPEG-2
维基百科,自由的百科全书
MPEG-2是MPEG工作组于1994年发布的视频和音频压缩国际标准。MPEG-2通常用来为广播信号提供视频和音频编码,包括卫星电视、有线电视等。MPEG-2经过少量修改后,也成为DVD产品的核心技术。
MPEG-2的系统描述部分(第1部分)定义了传输流,它用来一套在非可靠介质上传输數位视频信号和音频信号的机制,主要用在广播电视领域。
MPEG-2的第二部分即视频部分和MPEG-1类似,但是它提供对隔行扫描视频显示模式的支持(隔行扫描广泛应用在广播电视领域)。MPEG-2视频并没有对低位元速率(小于1Mbps)进行优化,在3Mbit/s及以上位元速率情况下,MPEG-2明显优于MPEG-1。MPEG-2向后兼容,也即是说,所有符合标准的MPEG-2解码器也能够正常播放MPEG-1视频流。
MPEG-2技术也应用在了HDTV传输系统中。
MPEG-2的第三部分定义了音频压缩标准。该部分改进了MPEG-1的音频压缩,支持两通道以上的音频。MPEG-2音频压缩部分也保持了向后兼容的特点。
MPEG-2的第七部分定义了不能向后兼容的音频压缩。该部分提供了更强的音频功能。通常我们所说的MPEG-2 AAC指的就是这一部分。
目录 |
MPEG-2标准技术细节
本章节的内容包括MPEG-2的技术细节但是不包括MPEG-2在DVD/DVB应用上的信息。
一个MPEG-2系统流一般包括两个基本元素:
- 视频数据 + 时间戳
- 音频数据 + 时间戳
MPEG-2视频编码概述
MPEG-2视频通常包含多个GOP(GOP = Group Of Pictures),每一个GOP包含多个帧。帧的帧类通常包括I-帧、P-帧和B-帧。其中I-帧采用帧内编码,P-帧采用前向估计,B-帧采用双向估计。
一般来说输入视频格式是25(CCIR标准)或者29.97 (FCC)帧/秒。
MPEG-2支持隔行扫描和逐行扫描。在逐行扫描模式下,编码的基本单元是帧。在隔行扫描模式下,基本编码可以是帧,也可以是场(field)。
原始输入图像首先被转换到YCbCr颜色空间。其中Y是亮度,Cb和Cr是两个色度通道。对于每一通道,首先采用块分割,然后形成“宏块”(macroblocks),宏块构成了编码的基本单元。每一个宏块再分割成8x8的小块。色度通道分割成小块的数目取决于初始参数设置。例如,在常用的4:2:0格式下,每个色度宏块只采样出一个小块,所以三个通道宏块能够分割成的小块数目是4+1+1=6个。
对于I-帧,整幅图像直接进入编码过程。对于P-帧和B-帧,首先做运动补偿。通常来说,由于相邻帧之间的相关性很强,宏块可以在前帧和后帧中对应相近的位置找到相似的区域匹配的比较好,这个偏移量作为运动向量被记录下来,运动估计重构的区域的误差被送到编码器中编码。
对于每一个8×8小块,离散余弦变换把图像从空间域转换到频域。得到的变换系数被量化并重新组织排列顺序,从而增加长零的可能性。之后做游程编码(run-length code)。最后作哈夫曼编码(Huffman Encoding)。
I帧编码是为了减少空间域冗余,P帧和B帧是为了减少时间域冗余。
GOP是由固定模式的一系列I帧、P帧、B帧组成。常用的结构由15个帧组成,具有以下形式IBBPBBPBBPBBPBB。GOP中各个帧的比例的选取和带宽、图像的质量要求有一定关系。例如因为B帧的压缩时间可能是I帧的三倍,所以对于计算能力不强的某些实时系统,可能需要减少B帧的比例。
MPEG-2输出的比特流可以是匀速或者变速的。最大比特率,例如在DVD应用上,可达10.4 Mbit/s。如果要使用固定比特率,量化尺度就需要不断的调节以产生匀速的比特流。但是,提高量化尺度可能带来可视的失真效果。比如马赛克现象。
MPEG-2音频编码
MPEG-2的音频编码包括:
- 低比特率下的MPEG-1 Layer 1/2/3 LSF。
- 多通道编码
- MPEG-2 AAC。
MPEG-2在DVD上的应用
DVD中采用了MPEG-2标准并引入如下技术参数限制:
- 分辨率
- 纵横比
- 4:3
- 16:9
- 帧率(帧播放速度)
- 59.94 场/秒,23.976帧/秒, 29.97帧/秒(NTSC)
- 50 场/秒,25帧/秒(PAL)
- 视频+音频 比特率
- 平均最大缓冲区 9.8 Mbit/s
- 峰值 15 Mbit/s
- 最小值 300 Kbit/s
- YUV 4:2:0
- 字幕支持
- 内嵌字幕支持(NTSC only)
- 音频
- LPCM编码:48kHz或96kHz;16或24-bit;最多可达6声道
- MPEG Layer 2 (MP2):48 kHz,可达5.1声道
- 杜比数字-Dolby Digital(DD,也称为AC-3):48 kHz,32-448 kbit/s,可达5.1声道
- 数字家庭影院系统-Digital Theater Systems (DTS):754 kbit/s或1510 kbit/s
- NTSC制式DVD必须包含至少一道LPCM或Dolby Digital
- PAL制式DVD必须包含至少一道MPEG Layer 2、LPCM或者Dolby Digital
- GOP结构
- 必须为GOP提供序列的头信息
- GOP最大可含帧数目:18 (NTSC) / 15 (PAL)
MPEG-2在DVB下应用
DVB-MPEG相关技术参数:
- 必须符合以下一种分辨率:
- 720 × 480 像素,24/1.001,24,30/1.001或30帧/秒
- 640 × 480 像素,24/1.001,24,30/1.001或30帧/秒
- 544 × 480 像素,24/1.001,24,30/1.001或30帧/秒
- 480 × 480 像素,24/1.001,24,30/1.001或30帧/秒
- 352 × 480 像素,24/1.001,24,30/1.001或30帧/秒
- 352 × 240 像素,24/1.001,24,30/1.001或30帧/秒
- 720 × 576 像素,25帧/秒
- 544 × 576 像素,25帧/秒
- 480 × 576 像素,25帧/秒
- 352 × 576 像素,25帧/秒
- 352 × 288 像素,25帧/秒
MPEG-2和NTSC
- 必须符合以下一种分辨率:
注:1080i按1920×1088像素编码,但是最后8行在显示时抛弃。
MPEG-2标准文档号码
- ISO/IEC 13818-1:系统-描述视频和音频的同步和多路技术
- ISO/IEC 13818-2:视频-视频压缩
- ISO/IEC 13818-3:音频-音频压缩,包括多通道的MP3扩展。
- ISO/IEC 13818-4:测试规范
- ISO/IEC 13818-5:仿真软件
- ISO/IEC 13818-6:DSM-CC(Digital Storage Media Command and Control)扩展
- ISO/IEC 13818-7:Advanced Audio Coding (AAC)
- ISO/IEC 13818-9:实时接口扩展
- ISO/IEC 13818-10:DSM-CC规范