【多媒体】音频格式

什么是比特率? 

  比特率是指将数字声音由模拟格式转化成数字格式的采样率,采样率越高,还原后的音质就越好。
  比特率值与现实音频对照:
  16kbps=电话音质
  24kbps=增加电话音质、短波广播、长波广播、欧洲制式中波广播
  40kbps=美国制式中波广播
  56kbps=话音
  64kbps=增加话音(手机铃声最佳比特率设定值、手机单声道MP3播放器最佳设定值)
  112kbps=FM调频立体声广播
  128kbps=磁带(手机立体声MP3播放器最佳设定值、低档MP3播放器最佳设定值)
  160kbps=HIFI高保真(中高档MP3播放器最佳设定值)
  192kbps=CD(高档MP3播放器最佳设定值)
  256kbps=Studio音乐工作室(音乐发烧友适用)
  320kbps=超级发烧友适用

MP3:格式是最为大家所熟知的了,目前使用的用户最多,网上最流行的音乐文件绝大部分也是MP3格式的。MP3全称是MPEG Audio Laye-3,属MPEG-1的等级。它诞生于1993年,其“父母”是德国夫朗和费研究院(Faunhofe IIS)和法国汤姆生(Thomson)公司。MP3是将声音用 1:10 甚至 1:12 的压缩率,变成容量较小的档案,但是在人耳听起来,却没有什么不同。当然这是一种失真压缩,就像图形档JPG一样,因为失真压缩,所以可以压的很多,也可以调整压缩比率,压的越多失真也越多。你会怀疑失真后的品质吗?只要不是太夸张的压缩比率,人耳是分辨不出来的,就像JPG档,不要压缩得太夸张,人眼是很难分辨出来的。早期的MP3编码技术并不完善,很长的一段时间以来,大多数人都使用128Kbps的CBR(固定编码率)格式来对MP3文件编码,直到VBR(可变编码率)和ABR(平均编码率)的压缩方式出现,编码的比特率最高可达320Kbps,MP3文件在音质上才开始有所进步,而LAME的出现,则为这一进步带来了质的飞跃。

WMA:是Windows Media Audio的缩写,是微软力推的数字音乐格式。微软官方宣布的资料中称WMA格式的可保护性极强,甚至可以限定播放机器、播放时间及播放次数,具有相当的版权保护能力。应该说,WMA的推出,就是针对MP3没有版权限制的缺点而来——普通用户可能很欢迎这种格式,但作为版权拥有者的唱片公司来说,它们更喜欢难以复制拷贝的音乐压缩技术,而微软的WMA则照顾到了这些唱片公司的需求,可以预见,唱片业可能将全力支持WMA标准。除了版权保护外,WMA还在压缩比上进行了深化,它的目标是在相同音质条件下文件体积可以变的更小(当然,只在MP3低于192Kbps码率的情况下有效,实际上当采用LAME算法压缩MP3格式时,高于192Kbps时普遍的反映是MP3的音质要好于WMA)。在低流量下,MP3的确是不如WMA来得好,甚至真的可以达到对半的程度,64kbps的WMA在波形还原以后的确要好于128kbps的MP3,原因就是低流量的MP3在编码时候丢弃了太多的高频信息,但是在128以上呢?情况出现了大逆转,MP3的质量逐步攀升,而WMA在高流量下几乎得不到什么质量上的增强了,换来的确是文件急剧增大,127kbps的WMA根本不是256kbpsMP3的对手了。至于96kbps流量下得到超过CD的音质更是无从算起,在48Khz采样率下WMA的表现也不是特别令人满意。WMA的优势在于低流量、优良的“流”性能和它良好的版权保护性能,至于高音质的问题,它还不是特别成熟。(WMA (Windows MediaAudio)格式是来自于微软的重量级选手,后台强硬,音质要强于MP3格式,更远胜于RA格式,它和日本YAMAHA公司开发的VQF格式一样,是以减少数据流量但保持音质的方法来达到比MP3压缩率更高的目的,WMA的压缩率一般都可以达到1:18左右,WMA的另一个优点是内容提供商可以通过DRM(DigitalcentersManagement)方案如Windows Media centersManager7加入防拷贝保护。这种内置了版权保护技术可以限制播放时间和播放次数甚至于播放的机器等等,这对被盗版搅得焦头乱额的音乐公司来说可是一个福音,另外WMA还支持音频流(Stream)技术,适合在网络上在线播放,作为微软抢占网络音乐的开路先锋可以说是技术领先、风头强劲,更方便的是不用象MP3那样需要安装额外的播放器,而Windows操作系统和WindowsMediaPlayer的无缝捆绑让你只要安装了windows操作系统就可以直接播放WMA音乐,新版本的WindowsMediaPlayer7.0更是增加了直接把CD光盘转换为WMA声音格式的功能,在新出品的操作系统WindowsXP中,WMA是默认的编码格式,大家知道Netscape的遭遇,现在“狼”又来了。WMA这种格式在录制时可以对音质进行调节。同一格式,音质好的可与CD媲美,压缩率较高的可用于网络广播。虽然现在网络上还不是很流行,但是在微软的大规模推广下已经是得到了越来越多站点的承认和大力支持,在网络音乐领域中直逼*.mp3,在网络广播方面,也正在瓜分Real打下的天下。因此,几乎所有的音频格式都感受到了WMA格式的压力。

WMAVB:全称是Variable Bit Rate,就是动态比特率。和传统的CBR编码不同,传统的CBR(Constents Bit Rate)就是静态比特率,约定死了采样率为固定值。一首歌曲从头至尾为某固定值如128KBit/s进行压缩。而VBR则采取了一种全新的,全程动态调节技术的压缩方法。当在低音段时,VBR会自动采用较低的比特率如32KBit/s对音质进行压缩,当在高音段时会用较高的比特率如224KBit/s对音质进行压缩,当在级高端时则采用最高320KBit/s进行压缩。WMAVB(MP3VB)就是在控制文件大小的情况下,最大限度的提高了音质。

WAV:这是一种古老的音频文件格式,由微软开发。WAV是一种文件格式,符合PIFF ;Resource ;Interchange ;File ;Format的规范。所有的WAV都有一个文件头,这个文件头音频流的编码参数。WAV对音频流的编码没有硬性规定,除了PCM之外,还有几乎所有支持ACM规范的编码都可以为WAV的音频流进行编码。很多朋友没有这个概念,我们拿AVI做个示范,因为AVI和WAV在文件结构上是非常相似的,不过AVI多了一个视频流而已。我们接触到的AVI由很多种,因此我们经常需要安装一些Decode才能观看一些AVI,我们接触到比较多的DivX就是一种视频编码,AVI可以采用DivX编码来压缩视频流,当然也可以用其他的编码压缩。同样,WAV也可以使用多种音频编码来压缩其音频流,不过我们常见的都是音频流被PCM编码处理的WAV,但这不表示WAV只能使用PCM编码,MP3编码同样也可以运用在WAV中,和AVI一样,只要安装好了相应的Decode,就可以欣赏这些WAV了。在Windows平台下,基于PCM编码的WAV是被支持得最好的音频格式,所有音频软件都能够完美支持,由于本身可以达到比较高的音质要求,因此,WAV也是音乐编辑创作的首选格式,适合保存音乐素材。因此,基于PCM编码的WAV被作为一种中介的格式,常常使用在其他编码的互相转换之中,例如MP3转换成WMA。

APE:是一种无损压缩音频格式。庞大的WAV音频文件可以通过Monkeys Audio这个软件进行"瘦身"压缩为APE,同样,APE也可以通过Monkeys Audio还原成WAV,再刻录成CD。很时候它被用做网络音频文件传输,因为被压缩后的APE文件容量要比WAV源文件小一半多,可以节约传输所用的时间。更重要的是,通过Monkeys Audio解压缩还原以后得到的WAV文件可以做到与压缩前的源文件完全一致。所以APE被誉为“无损音频压缩格式”,Monkeys Audio被誉为“无损音频压缩软件”。与采用WinZip或者WinRAR这类专业数据压缩软件来压缩音频文件不同,压缩之后的APE音频文件是可以直接被播放的

AAC:音频格式就像电脑软硬件一样,终归要更新换代的,像磁带不是被CD淘汰了吗?而CD也将要被DVD-Audio所代替。随着时间的推移,MP3越来越不能满足我们的需要了,比如压缩率落后于Ogg、VQF等格式,音质也不够理想(尤其是低码率下),仅有两个声道……于是Fraunhofer IIS与AT&T、索尼、杜比、诺基亚等公司展开合作,共同开发出了被誉为“21世纪的数据压缩方式”的Advanced Audio Coding(简称AAC)音频格式,以取代MP3的位置。其实AAC的算法在1997年就完成了,当时被称为MPEG-2 AAC,因为还是把它作为MPEG-2标准的延伸。但是随着MPEG-4音频标准在2000年成型,MPEG-2 AAC也被作为它的编码技术核心,同时追加了一些新的编码特性,所以我们又叫MPEG-4 AAC。AAC的音频算法在压缩能力上远远超过了以前的一些压缩算法(比如MP3等)。它还同时支持多达48个音轨、15个低频音轨、更多种采样率和比特率、多种语言的兼容能力、更高的解码效率。总之,AAC可以在比MP3文件缩小30%的前提下提供更好的音质

ATRAC3:是ATRAC压缩技术的提升版本,是MD(MiniDisk便携随身听音乐格式)也是Sony独有的音乐压缩技术。相比于ATRAC,ATRAC3的压缩率更高,它可将音乐档案压缩至相等于CD音乐所需数据储存空间的十分之一,同时无损音乐素质。因为,它除了保留ATRAC的原有压缩技术之外,更应用了人类听觉心理学理论。那究竟什么是ATRAC呢?MD的压缩格式,全称为Adaptive Transform Acoustic Coding,是一种有损压缩格式。ATRAC将16比特44.1KHz的数字信号以频率响应轴分成52个区段(在低频时分割较细而在高频时分割较粗),统计分析表明,这些信号中存在多种冗余度,编码时可以除去这些冗余从而减小文件体积,在解码时这些冗余可以再重新建立。而ATRAC技术就是利用人耳听觉的心理声学特性(频谱掩蔽特性和时间掩蔽特性)以及人耳对信号幅度、频率、时间的有限分辨能力,编码时凡是入耳感觉不到的成分不编码,不传送,即凡是对人耳辨别声音信号的强度、音调、方位没有贡献的部分(称为不相关部分或无关部分)都不编码和传送。除了在编码过程中使用这种心理声学特性,ATRAC算法还把它应用在时间-频率的分割过程中。通过结合子频带译码和转换译码技术,输入的信号被分析到不均匀的强调重要低音区域的频率分。另外,ATRAC使用一个可变块长度改编输入的信号。这可以确保在稳定通过时高效的译码而不会在瞬时通过时影响时间的分辨率。利用这种原理,ATRAC可以将录音的资料量压缩为原来的五分之一(即压缩比为1:5)。一句话概括,ATRAC的主要任务就是把16位、44.1kHz的立体声音频进行压缩。
歌曲试听比特率最理想是压缩到96Kbps的wma格式或192Kbps的mp3格式

 

VQF格式
VQF格式是由YAMAHA和NTT共同开发的一种音频压缩技术,它的压缩率能够达到1:18,因此相同情况下压缩后VQF的文件体积比MP3小30%~50%,更便利于网上传播,同时音质极佳,接近CD音质(16位44.1kHz立体声)。但VQF未公开技术标准,至今未能流行开来。

OGG格式

Ogg全称应该是OGG Vobis(ogg Vorbis) 是一种新的音频压缩格式,类似于MP3等现有的音乐格式。

但有一点不同的是,它是完全免费、开放和没有专利限制的。OGG Vobis有一个很出众的特点,就是支持多声道,随着它的流行,以后用随身听来听DTS编码的多声道作品将不会是梦想。

 

音频格式比较:
音乐爱好者常见的音频格式有:flac、ape、wav、mp3、aac、ogg、wma
1.压缩比比较:
aac>ogg>mp3(wma)>ape>flac>wav(同一音源条件下)
mp3和wma以192kbps为分界线,192kbps以上mp3好,192kbps以下wma好。

2.音质比较:
wav=flac=ape>aac>ogg>mp3>wma

3.硬件支持比较:
MP3播放器:mp3>wma>wav>flac>ape aac ogg
手机:mp3>wma>aac wav>flac ogg>ape

4.综合性能(就是综合音质体积编码率):aac>ogg>flac ape>mp3>wav、wma

(zz多个博客以及百度百科)

posted @ 2012-09-19 10:04  大脚印  阅读(816)  评论(0编辑  收藏  举报