旅行者

海内存知己,天涯若比邻。

博客园 首页 新随笔 联系 订阅 管理
随着计算机的发展,周边的数字视频设备也逐渐得到更广泛的使用。个人也可以玩视频,音频制作VCD,SVCD,DVD甚至网上视频。 这些东西接触的多了也知道了视频图像压缩的必要。究竟视频图像为什么需要压缩呢!让我们看看下面两个原因吧!

首先,传输数字图像所需的带宽远窄于未压缩图像。例如,NTSC图像以大约640 x 480的分辨率,24bits/象素,每秒30帧的质量传输时,其数据率达28M字节/秒或221M位/秒。此外,NTSC声音信号还要使未压缩图像的比特率再增加一些。然而单速CD-ROM(1x)驱动器只能以1.2M位/秒的速率传输数据。
第二个原因是以28M字节/秒的速率,15秒的未压缩图像将占用420M字节的内存空间,这对于大多数只能处理小图像片断的台式计算机来说都是不可接受的。
当今把图像加入电子信号的关键问题是压缩方式。有几种不同的压缩方式,但MPEG是最有市场潜力的压缩方式。

MPEG的全称是Moving Pictures Experts Group(即动态图像专家组),由ISO(International Standards Organization,国际标准化组织)与IEC(International Electronic Committee)于1988年联合成立,致力于运动图像(MPEG视频)及其伴音编码(MPEG音频)标准化工作。MPEG共有4个版本,其中前两个版本MPEG-1和MPEG-2应用比较广泛,而MPEG-4虽然已推出近两年,但有关它的应用却直到最近才活跃起来,MPEG-7则是属于未来的标准。

 MPEG-1标准(ISO/IEC11172)制定于1992年,是针对1.5Mbps以下数据传输率的数字存储媒体运动图像及其伴音编码设计的国际标准,主要用于在CD-ROM(包括Video-CD、CD-I等)存储彩色的同步运动视频图像,它针对SIF(标准交换格式)标准分辨率(NTSC制为352×240;PAL制为352×288)的图像进行压缩,每秒可播放30帧画面,具备CD(指激光唱盘)音质。同时,它还被用于数字电话网络上的视频传输,如非对称数字用户线路(ADSL)、视频点播(VOD)、教育网络等。 它的目的是把221Mbit/秒的NTSC图像压缩到1.2Mbit/秒,压缩率为200:1。使用MPEG-1的压缩算法,可以将一部120分钟长的电影压缩到1.2GB左右,因此,它被广泛地应用于VCD制作和一些视频片段的下载,目前90%以上的VCD都是用MPEG-1格式压缩的。目前一些制作VCD的采集压缩卡,像SNAZII DVC,MP 10,白老汇等都是采用MPEG-1压缩标准。

  MPEG-2用于宽带传输的图像,图像质量达到电视广播甚至HDTV的标准。和MPEG-1相比,MPEG-2支持更广的分辨率和比特率范围,将成为数字图像盘(DVD)和数字广播电视的压缩方式。这些市场将和计算机市场交织在一起,从而使MPEG-2成为计算机的一种重要的图像压缩标准。MPEG-2标准ISO/IEC13818)制定于1994年,是针对3~10Mbps的数据传输率制定的的运动图像及其伴音编码的国际标准。MPEG-2可以提供一个较广的范围改变压缩比,以适应不同画面质量、存储容量和带宽的要求。它在与MPEG-1兼容的基础上实现了低码率和多声道扩展:MPEG-2可以将一部120分钟长的电影压缩到4~8GB(它提供的是我们通常所说的DVD品质),其音频编码可提供左右中及两个环绕声道、一个加重低音声道和多达7个伴音声道(因此DVD可有8种语言配音)。除了作为DVD的指定标准外,MPEG-2还可用于为广播、有线电视网、电缆网络等提供广播级的数字视频。不过对普通用户来说,由于现在电视机分辨率的限制,MPEG-2所带来的高清晰度画面质量(如DVD画面)在电视上效果并不明显,倒是其音频特性(如加重低音、多伴音声道等)得到了广泛的应用。 MP3是应用于MPEG-1的一项音频压缩技术标准,英文全称是MPEG-1 Audio Layer3。做出这个定义的依据是:第一,MPEG官方已经明确表示,MP3和MPEG-1 Audio Layer3是指同一件事情。第二、Layer技术的发布者Fraunhofer IIS-A[注1]官方技术文档中也提到过,MP3就是MPEG-1 Audio Layer3。此外,在很多知名厂商比如SONY、Philips的一些相关技术文档中也直接说明了MP3是MPEG-1 Audio Layer3的问题(参考相应技术部分)。
  
MPEG-3是ISO/IEC最初为HDTV(高清晰电视广播)制定的编码和压缩标准,但由于MPEG-2的出色性能已能适用于HDTV,因此MPEG-3标准并未制定,我们通常所说的MP3指的是MPEG Layer 3,只是MPEG的一个音频压缩标准。
  
令人称道的MPEG-4

  MPEG-4于1998年11月公布,预计投入使用的国际标准MPEG-4是针对一定比特率下的视频、音频编码,更加注重多媒体系统的交互性和灵活性。为此,MPEG-4引入了AV对象(Audio/Visual Objects),使得更多的交互操作成为可能:
  “AV对象”可以是一个孤立的人,也可以是这个人的语音或一段背景音乐等。它具有高效编码、高效存储与传播及可交互操作的特性。
  MPEG-4对AV对象的操作主要有:采用AV对象来表示听觉、视觉或者视听组合内容;组合已有的AV对象来生成复合的AV对象,并由此生成AV场景;对AV对象的数据灵活地多路合成与同步,以便选择合适的网络来传输这些AV对象数据;允许接收端的用户在AV场景中对AV对象进行交互操作等。
  
MPEG-4标准则由6个主要部分构成:


1 DMIF(The Dellivery Multimedia Integration Framework)
DMIF 即多媒体传送整体框架,它主要解决交互网络中、广播环境下以及磁盘应用中多媒体应用的操作问题。 通过传输多路合成比特信息来建立客户端和服务器端的交互和传输。 通过DMIF,MPEG4可以建立起具有特殊品质服务(QoS)的信道和面向每个基本流的带宽。

2 数据平面
MPEG4中的数据平面可以分为两部分:传输关系部分和媒体关系部分。
为了使基本流和AV对象在同一场景中出现,MPEG4引用了对象描述(OD)和流图桌面(SMT) 的概念。OD 传输与特殊AV对象相关的基本流的信息流图。桌面把每一个流与一个CAT(Channel Assosiation Tag)相连,CAT可实现该流的顺利传输。

3 缓冲区管理和实时识别
MPEG4定义了一个系统解码模式(SDM),该解码模式描述了一种理想的处理比特流句法语义的解码装置,它要求特殊的缓冲区和实时模式。通过有效地管理,可以更好地利用有限的缓冲区空间。

4 音频编码
MPEG4的优越之处在于——它不仅支持自然声音,而且支持合成声音。MPEG4的音频部分将音频的合成编码和自然声音的编码相结合,并支持音频的对象特征。

5 视频编码
与音频编码类似,MPEG4也支持对自然和合成的视觉对象的编码。 合成的视觉对象包括2D、3D 动画和人面部表情动画等。

6 场景描述
MPEG4提供了一系列工具,用于组成场景中的一组对象。一些必要的合成信息就组成了场景描述,这些场景描述以二进制格式BIFS(Binary Format for Scene description)表示,BIFS与AV对象一同传输、编码。场景描述主要用于描述各AV对象在一具体AV场景坐标下,如何组织与同步等问题。同时还有AV对象与AV场景的知识产权保护等问题。MPEG4为我们提供了丰富的AV场景。
MPEG-4的应用

  与MPEG-1和MPEG-2相比,MPEG-4更适于交互AV服务以及远程监控,它的设计目标使其具有更广的适应性和可扩展性: MPEG-4传输速率在4800-64000bps之间,分辨率为176×144,可以利用很窄的带宽通过帧重建技术压缩和传输数据,从而能以最少的数据获得最佳的图像质量。因此,它将在数字电视、动态图像、互联网、实时多媒体监控、移动多媒体通信、Internet/Intranet上的视频流与可视游戏、DVD上的交互多媒体应用等方面大显身手。

  当然,对于普通用户来说,MPEG-4在目前来说最有吸引力的地方还在于它能在普通CD-ROM上基本实现DVD的质量:用MPEG-4 压缩算法的ASF(Advanced Streaming format,高级格式流)可以将120分钟的电影压缩为300MB左右的视频流;采用MPEG-4压缩算法的DIVX 视频编码技术可以将120分钟的电影压缩600MB左右,也可以将一部 DVD影片压缩到 2 张 CD-ROM上!也就是说,有了MPEG-4,你不需要购买 DVD-ROM 就可以享受到和它差不多的视频质量!播放这种编码的影片对机器的要求并不高:只要你的电脑有300MHz 以上(无论是哪种型号)的CPU、64MB内存、8MB的显卡就可以流畅地播放。


  不过,和DVD相比,MPEG-4属于一种高比率有损压缩算法,其图像质量始终无法和DVD的MPEG-2相比,毕竟DVD的存储容量比较大。此外,要想保证高速运动的图像画面不失真,必须有足够的码率,目前MPEG-4的码率虽然可以调到和DVD差不多,但总体效果还有不小的差距。因此,现在的MPEG-4只能面向娱乐、欣赏方面的市场,那些对图像质量要求较高的专业视频领域暂时还不能采用。
posted on 2004-07-12 13:29  旅行者  阅读(3918)  评论(0编辑  收藏  举报