Minisky

好记性不如个烂笔头,记一些有用的东西!
  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

【转】各种多媒体格式以及codec简析

Posted on 2010-09-14 14:04  Minisky  阅读(717)  评论(0编辑  收藏  举报

首先要明白几个概念:
A、扫描线和分辨率
     扫描线可以理解为将屏幕水平方向分成一条条直线,就像水平直线组成一个平面一样。屏幕的清晰度基本上取决于其扫描线的细腻程度,也可以通俗地来讲扫描线决定了屏幕的物理分辨率,物理分辨率是指屏幕最多能显示的像素点数。物理分辨率决定了屏幕能达到的最高分辨率,除了屏幕的最高分辨率以外还有一个兼容分辨率的概念,比如说一个640*480的屏幕也许也能播放1080*720格式的信号,会将信号压缩到屏幕能显示的范围。总结来说扫描线决定了清晰度和分辨率,下面列举几种常用的扫描格式 :


1、D1为480i格式,和NTSC模拟电视清晰度相同,525条垂直扫描线,483条可见垂直扫描线,4:3 或16:9,隔行/60Hz,行频为15.25KHz。
2、D2为480P格式,和逐行扫描DVD规格相同,525条垂直扫描线,480条可见垂直扫描线,4:3 或 16:9,分辨率为640×480,逐行/60Hz,行频为31.5KHz。
3、D3为1080i格式,是标准数字电视显示模式,1125条垂直扫描线,1080条可见垂直扫描线,16:9,分辨率为1920×1080,隔行/60Hz,行频为33.75KHz。
4、D4为 720p格式,是标准数字电视显示模式,750条垂直扫描线,720条可见垂直扫描线,16:9,分辨率为1280×720,逐行/60Hz,行频为45KHz。
5、D5为1080p格式,是标准数字电视显示模式,1125条垂直扫描线,1080条可见垂直扫描线,16:9,分辨率为1920×1080逐行扫描,专业格式。
6、此外还有576i,是标准的PAL电视显示模式,625条垂直扫描线,576条可见垂直扫描线,4:3或16:9,隔行/50Hz,记为576i或625i。
 
      以上标准中“i”表示隔行,“P”表示逐行。HDTV标准是高品质视频信号标准,包括1080i、720p、1080p,也就是说D3、D4、D5属于 HDTV标准,但目前支持480p也大概称为支持HDTV。要注意的是,对于电视机处理能力(例如带宽)的要求则是 480i<480p<1080i<720p。所以目前很少有支持色差输入720p的电视机,但是支持1080i或者1080i Ready的就不少。
  数字高清电视的720p、1080i和1080p是由美国电影电视工程师协会确定的高清标准格式,其中1080p被称为目前数字电视的顶级显示格式,这种格式的电视在逐行扫描下能够达到1920×1080的分辨率。目前世界上只有60英寸以上的显示屏才能够显示出1920×1080的信号。目前市场上出现的所谓1080p高清数字电视并不能真正给消费者带来 1920×1080的图像,这些彩电只是能够接收和处理1920×1080格式的信号而已,由于目前电视信号根本无法达到如此高的标准,1080p对于普通用户基本没有什么实际价值。

B、multimedia container format
      多媒体 容器格式,像我们播放的多媒体格式比如说.mp4,.3gp,.avi,.asf 等等都是多媒体容器格式,他们包含多种编码格式的video和audio,在多媒体上的mux和demux就是将文件 格式中的audio和video数据混合(mux)以及解码过程中的分离(demux)。下面我们看看几个容器格式:


1、MP4
由MPEG-4定义的一种多媒体容器格式[MPEG-4 part14],广泛用来存储音频和视频流,也可以存储静态图像和字幕等等。基本可以存储绝大多数能嵌入到MP4中的数据 :
Video: MPEG-4 Part 10 (or H.264, also known as MPEG-4 AVC), MPEG-4 Part 2, MPEG-2, and MPEG-1.
Audio: MPEG-2 Part 7 (also known as AAC), Apple Lossless, MPEG-1 Audio Layer 3 (also known as MP3), MPEG-4 Part 3, MPEG-1 Audio Layer II (also known as MP2), MPEG-1 Audio Layer I, CELP (speech), TwinVQ (very low bitrates), SAOL(MIDI).
Subtitles: MPEG-4 Timed Text (also known as 3GPP Timed Text).

2、3gp
3gp是由3GPP制定的主要在移动设备上使用的一种多媒体容器格式,扩展名.3gp一般用在GSM上,.3g2一般用在CDMA上,3gp实际上和MP4非常相似,两者都是基于MPEG4-part12的。3gpp携带的流媒体一般是:
Video: MPEG4-part2/ h263    MPEG4-part10 / h264
Audio: AAC   AMR-NB   AMR-WB

3、mkv
Matroska Multimedia Container是完全开源的一种多媒体容器格式,它可以将多种编码格式的视频以及多达16种格式的音频以及各种字幕数据封装在一个Matroska media文件中。mkv号称的目标应该是取代现在一些.asf .avi之类的封装格式,但开源的东西能到什么成就谁也不知道~~

4、AVI
avi是微软出的东西,主要用在多媒体光盘上用来存储电视和电影,因为其体积过大而且本身标准前后的不兼容,将来在手机上应该用得不多,这里就不说了,有兴趣的可以去wiki上查。

除了这些之外还有apple的quicktime阿,ASF,VOB等等很多,在手机上应该用得不多,这里也就不多说了。


现在再来看各种基础 的编解码,现在主流的音乐编码就是AAC和MP3了,人声编码应该主要的还是AMR和AMR+ ,而视频现在主要的几种就是h263 ,h264,mpeg4,实际上除了AMR是3gpp的之外,其他都是MPEG协议簇里面的内容。另外还有微软的WMA和WMV就不说了。

MPEG(Moving Picture Experts Group )是ISO最早提出的用于音视频压缩和传输的一个协议 簇,这个协议簇应该来说是很庞大的,分为很多版本比如MPEG-1, MPEG-2, MPEG-3, MPEG-4等等。下面我们只选择我们将来可能用到的说一下:

1、MPEG-1 Audio layer 3
就是我们熟悉的MP3,实际上它是mpeg-1协议中的内容,实际上它的发展也经历了mp1,mp2,最后才到mp3,mp3是一种有损压缩的音乐压缩格式。

2、MPEG-4 part 2   : MPEG-4 sp  和 MPEG-4 asp
两者是不一样的,sp主要用在低速率的情况下比如说移动设备,而asp则实际上和h263类似的

3、MPEG-4 part 3
就是我们不怎么熟悉的AAC(advanced audio codec ),应该说aac将来是会取代mp3的,它支持96KHZ的采样频率,支持到48个声道,以及各种技术 如SBR等,提供高压缩和高质量的音频。

4、MPEG-4 part 2    MPEG-4 part 10
这是我们应该也不怎么熟悉的H263和h264(AVC ),实际上h26x系列协议都是后面加入MPEG-4协议簇中的,因为其高性能的压缩。虽然同处一个框架内,但是实际上他们和MPEG-4不是同一种视频 codec。应该说是根据性能用在不同方面的codec,MPEG-4现在是主要用在监控领域的视频编码。h264又分很多版本,包括BP,SP,HIP 等等。

最后说一下人声编码AMR,人声编码是一种高压缩的编码方式,它同音乐编码是采用的完全不同的算法,应该说他们基本上都是基于CELP的,AMR是由3gpp定义的,包括窄带AMRNB和在宽带上使用的AMRWB


本文来自CSDN博客,转载请标明出处:http://blog.csdn.net/yili_xie/archive/2009/11/12/4803509.aspx