MPEG2、H.263、H.264对比
1.1 MPEG2 、 H.263 、 H.264 协议效率对比
ITUT 中定义的双向视频通信协议族包括: H.320 、 H.323 ,这两个协议族中,包含了很多子协议,例如音频编码协议、视频编码协议等,其中视频编码包括: H.261 、 H.263 、 H.264 几种主要协议,其中 H.261 、 H.264 协议已经比较成熟,技术市场上所有的产品都支持, H.264 协议是 2003 年发布的新的编码协议,相对于 H.263 协议,大幅度提高了在低带宽和网络质量比较差的情况图像的效果,目前已经成为视频编码协议的发展趋势。
除此之外,在中国市场上(仅仅在中国市场上),还存在把基于有线电视单向传输的 MPEG2 协议包装成双向视频通信的技术分支。
下面的材料来自于 ITUT/ISO JVT 主席 Thomas Wiegand 的演示文稿。从下面的数据上, MPEG2 是各种压缩算法中最差的一种,完全靠消耗带宽来提高图像的质量。比较典型的对比是: 3M 的 MPEG2 质量相当于 2.0M 的 H.263 图像质量,相当于 1.4M 的 H.264 (关于 H.264 的描述,下面有相关的说明)的图像质量。
1.2 各种协议对带宽的占用
1.2.1 MPEG2 协议
“ 1 . 8.192Mbit/s :分解力为 720 × 576 ,每秒 25 帧,图像清晰,色彩鲜明,画面逼真,层次感强,图像剧烈运动时马赛克效应不可察觉(在一般会议室环境照度下),为数字地面广播级图像。
2 . 6.144Mbit/s :分解力为 720 × 576 ,每秒 25 帧,图像清晰,色彩较鲜明,画面逼真,层次感较强,图像剧烈运动时马赛克效应偶可察觉(在一般会议室环境照度下)。
3 . 4.096Mbit/s :分解力为 720 × 576 ,每秒 25 帧,图像清晰度和色彩鲜明度较以上两种速率略有下降,画面较逼真,层次感一般,图像剧烈运动时马赛克效应刚可察觉(在一般会议室环境照度下)。”
4 .在 2M 以下的带宽下基本不可用。
上面的结论就是:如果要达到比较好的效果, MPEG2 产品需要至少到 6M 。而且其带宽只能在 2M 、 4M 、 6M 、 8M 之间切换。
1.2.2 H.263 、 H.261 协议
协议规定的最高带宽是 2M ,一般情况下,在 384k 可以基本商用, 768k 带宽即可达到一般商用效果, 2M 带宽下,可以达到 CIF 分辨率、 25 帧以上的效果,达到高端客户需求。
1.2.3 H.264 协议
相对于 H.263 协议, H.264 在低带宽下有了长足的进步,可以达到的效果是: 256k 即可基本商用, 1M 带宽即可达到高端商用客户需求, 2M 带宽可以达到支持动态 4CIF 图像效果,和 MPEG2 协议 8M 带宽效果相当。
1.2.4 综述
按照市场推算, 2004 年以前,市场上的视讯系统主流协议将是 H.263 , 2005 年初开始,将逐步切换到 H.264 协议。
1.3 MPEG2 产品和 H.263 、 H.264 产品的级联
MPEG2 厂商在一些分级网络中,推荐的 MPEG2 + E1 级联( H.263 )的组网方案,这种方案从其实现原理上看,就是采用最原始的互通方案:模拟转接实现的, MPEG2 码流需要通过外置的 MPEG2 解码器,生成模拟视音频码流,传递到 MCU 的画面处理板上,再发送到 E1 终端上。如果 MPEG2 的终端观看 E1 的终端图像,则还需要增加一个 MPEG2 编码器。
而且如果有多个类似会议同时召开,则需要多组 MPEG2 编解码器。
这种方案有大量的数字模拟信号转换之间的损耗,效果比较差,没有任何技术可言。由于采用的是模拟信号,因此除了基本语音和图像外,其他所有的会议功能基本都会失效。
1.3.1 MPEG2 产品只有 E1 专线的产品,不能是纯 IP 的视讯系统级联。
1.4 系统能够提供的功能
从系统体系上看,协议族产品可以很容易的和用户内部的 IP 网络、电信的 ISDN 网络、电信的 PSTN 网络等连接在一起,形成一个有很强扩充能力系统。可以轻松的实现外围应用:比如领导在办公室参加会议、员工在办公桌上参加会议、用户出差的时候通过 ADSL 、 ISDN 参加会议、用户通过普通电话接入会议等。而 MPEG2 产品由于只有一种高带宽、高价格产品,而且不能和其他产品兼容,这样就大大的限制了其应用范围。
视频系统发展到如今,用户对视频的需求已经不仅仅限制在图像和声音了,更多的关于使用方便、内容丰富( PC 机内容输入)、多画面、功能齐全的要求。而 MPEG2 产品由于协议和技术本身的限制,仅仅能否满足用户图像传递和简单的会议控制功能,
1.5 下一代产品的发展方向
2003 年中, ITUT 已经公布了 H.264 协议, H.264 协议相对于 H.263 协议,其编码算法有了大幅度的改进,从图 4 中即可看到明显的差异。在 2M 以上的带宽上,增加带宽对提高图像质量已经没有多大的用途。预计 2005 年初以后, H.264 产品将完全替换掉现有网络上的 H.263 产品,同样因为在低带宽下已经实现了高带宽的效果, MPEG2 产品注定要昙花一现的命运。
目前业界主流厂商已经开发出了 H.264 产品,华为公司也将在 2004 年推出对应的产品,现有网络的局端设备大部分都可以通过升级改造到 H.264 系统。
由于 MPEG2 产品的设计机理不一致,因此不能升级到 H.264 系统。
1.6 兼容性
兼容性决定了系统以后的发展,如果一个系统只能由一个厂商提供支持,不能兼容其他的产品,对于以后网络的发展来说影响是非常深远的。一旦建立了这样的原始体系,那么就是说被牢牢的套在这个独木桥上。以后的扩容、升级、服务等都已经没有了可选择性。
H 系列目前主流厂商之间已经实现互联互控,兼容性比较好,而 MPEG2 产品,由于采用的私有协议,即使是同系列的产品,不同厂商之间也是不能兼容的
1.7 图像和声音的延时
从标准上, MPEG-II 标准是基于广播式业务而非交互式业务:编码端非常复杂昂贵,解码端非常简单便宜,不适合作为交互式会议电视标准。 H.26x 标准基于交互式业务,编解码分担工作量,特别适合会议电视的应用模式。
MPEGII 编码的主要步骤是运动估计、帧差计算、 DCT 及 Huffman 编码。为了在高压缩比下获得良好的压缩效果必须尽可能的消除图象的相关性。 MPEG 支持大范围的运动估计。可以在参考帧的较大范围内寻找最小的误差块。运动估计的搜索范围对压缩质量有很大的影响,根据计算在 MPEG 编码端,运动估计的计算量占整个编码算法运算量的 80 %以上。而在解码端,根据运动矢量定位参考帧则要容易得多。运算量的不同决定了系统复杂度及成本的不同。因此在高质量的 MPEG - 2 应用中,编码器的成本往往要高出解码器成本许多。
MPEG 视频压缩序列支持两个连续的双向预测帧、半象素精度的运动补偿等特性。在规定的带宽下要获得最优的图象质量必然要最大限度的利用这些特性,所带来的问题就是编解码延迟的增加。
由于 H 协议族就是为双向交流设计的,因此非常强调及时性,在目前产品中时延基本都可以控制在 200ms 以内,由于视觉和听觉的暂留性,用户根本感觉不到时延。
MPEG2 产品由于采用的算法比较复杂,决定其编解码过程比较耗时;
MPEG2 协议当时是为单向广播应用设计的,因此对延时的要求不是很强烈。从目前应用看,会议经过 MCU 后的延时大概在 1S 左右,因此会议有比较明显的停顿感,如果经过了 MPEG2 和 E1 之间的转换,延时会更高。
1.8 系统运行成本
从结构上看, H 系列的产品经过多年的发展,已经形成了比较完备的体系结构,整个系统的编码和解码等都在一个系统中完成。同时 H 系列产品的协议本身决定其可实现性较高,因此产品价格比较低,有非常丰富的不同价格产品够选择。
而 MPEG2 产品目前都是采用有编码器、解码器、适配器三个部分组成的,协议本身的复杂性决定了产品价格的昂贵。
线路成本:由于采用高带宽的线路,线路成本对用户将是一个比较沉重的负担,目前一条 2M 线路每个月的费用是 30000 元人民币。这样,一个有 10 个会场的系统,每个月的费用为: 10 × 30000 × 2 = 600000 元,而使用标准的 2M 线路的费用是 150000 元,要节省了 75% 的费用。
维护成本:由于 MPEG2 产品本身的稳定性和对线路的高要求,因此每次开会都要进行调机和专人职守,这样对用户来说,无疑是一个比较大的人力成本投入。而 H 系列产品已经实现了全网设备的无人职守,就没有此忧。
1.9 系统的可运营特性
从实际的效果看, 2M 的 H 协议产品和 8M 的 MPEG2 产品已经没有太大的感官差异。但是他们对线路的需求确是差异非常大。如果组建一个全国网,有 200 个点,每个终端需要 8M 带宽,那么对骨干网的带宽要求是: 8*200 = 1600M , MCU 侧接入带宽就要到 1600M ,这样的线路成本,对任何运营商都是难以接受的。而对用户收取的费用是不能× 4 的,因此这样的系统盈利能力太低,根本不能运营。
而 H 系列产品,由于速率可以在 128k - 1920k 之间平滑过渡,对网络的压力将大大的降低。这样对运营商来说,很容易提供差别服务,很快盈利。
2 MCU 的建网模式
2.1 分布式级联组网
这种组网模式下, MCU 按照地域的方式配置, MCU 之间通过少量的线路用于级联,会议模式是:市级 MCU 下的终端开会直接在市 MCU 上完成,跨市的终端召集会议通过 MCU 的级联实现。
2.2 集中组网
这种组网模式下, MCU 集中配置,会议模式是:无论什么会议,所有的码流都是集中在省局汇聚再下发。
2.3 两种模式优缺点
分布建网模式优点:
市级会议的码流不会上报,不需要占用长途传输线路,也降低因为线路原因导致的会议故障率上升。
分布建网模式缺点:
由于市之间的 MCU 没有线路连接,跨市的专线会议需要通过省级 MCU 级联完成( IP 会议则无此约束)。
一般来说,维护码流和业务码流要分开,分布式组网需要设备支持业务和维护网分离。
集中组网的优缺点和分布式组网恰好相反。从目前视讯运营网的发展方向上看,逐步向以 IP 为主,专线为附的模式发展,因此华为建议采用分布式组网。
同时华为开发出了全网资源统一调度、统一管理、自动级联、自动级联会议控制等大量为视讯运营定制的技术,可以确保分布式组网高效运转。
3 业务模式
视讯系统从当初的 H.320 专线系统发展到现在,已经逐步形成了一个集视频、语音、数据通信于一身的综合视讯业务,为了吸引客户,最大限度的增加客户的接入范围,必须建立一个综合的视讯网络。
目前主要的业务模型有:
政府、行业专线会议,一般采用 2M 专线实现,专网专用,强调会议稳定性
公众商业会议,一般采用 IP 或 IP +专线的模式实现,市场需求量很大,网络接入条件复杂。对于跨国会议,一般采用 ISDN + IP 的模式(欧洲、北美的 ISDN 线路极其发达,类似中国的 ADSL ,网络上有大量的 ISDN 设备)
电话加入会议,主要为外地客户或客户出差使用。
可视电话通信,主要为个人用户准备,联系亲情、友情和熟悉的商业客户之间的交流,是将来的 3G 的固化版本。
网吧业务,主要提供了 VOIP 和可视电话通信的业务方式。
为了达到上面的业务模式,要求视讯设备具备下面的基本要求:
1、 综合接入,能够接入 E1 、 IP 、 ISDN 、电话等线路
2、 大容量、高稳定性,全系统支持主备倒换
3、 支持复杂的网络环境,可以有效的实现防火墙等穿越
4、 厂商能够提供全系列的产品解决方案,并能够定制开发