音视频开发-全网最全常用音视频编码和格式汇总
现在网上很多技术想学点东西太难了,要收钱才能看!技术是无界限的!恼火了我自己整理,全网最全、最厚道的技术开发者:
编码格式汇总:
音频编码:AAC、AC-3、Revision A、ALAC、AMR、ATRAC 、APE、DTS、FLAC、MP3、Ogg、PCM、RealAudio、WMA
MPEG Audio Layer 1/2
MPEG Audio Layer 3(MP3)
MPEG2 AAC
MPEG4 AAC
Windows Media audeo v1/v2/v3/7/8/9M
RealAudio cook/sipro(real media series)
Real Audio AAC/AACPlus(real media series)
QDesign Music 2(apple series)(是 QDesign公司开发的用于高保真高压缩率的编码方式,类似于MP3,不过比MP3要先进。支持流式播放)
Apple MPEG-4 AAC(apple series)
ogg( ogg vorbis音频)
AC3(DVD专用音频编码)
DTS(DVD专用音频编码)
APE( monkey's音频)
AU(sun格式)
FLAC( fress lossless音频)
M4A(mpeg-4音频)(苹果改用的名字,可以改成mp4)MP2( mpeg audio layer2音频)
AWMA
音频容器格式:很多,列举常用和主流的:wav、aiff、mp3、m4a、amr、wma、ogg
.wav无压缩无损:WAV文件以最高质量捕获并重新创建原始音频波形,而不会以任何方式影响或改变声音的声音特征。WAV使用PCM(脉冲编码调制)对数据进行编码,方法是将数据切成小块以提供最高质量。这是一种无损文件格式,意味着没有任何数据丢失。因此,捕获和记录的是原始音频波形的最接近的数学/数字表示形式,在此过程中不会发生明显的音频质量损失。WAV文件也未压缩,这意味着数据以完全原始格式原样存储,不需要解码。这提供了巨大的多功能性,可以进行出色的编辑和操作。
.aif无压缩无损:AIFF(音频交换文件格式)是在WAV之后不久创建的,其工作原理相同:它提供录音棚级的音频记录和播放。AIFF提供与WAV文件一样的采样率和位深选项,AIFF使用PCM将音频波形注册为准确的采样(切片),以提供尽可能高的音频录制质量和声音复制。就像WAV一样,AIFF也以未压缩的无损格式存储数据,这意味着您不会损失任何质量,而只会获得纯净的音质。。
.mp3有损压缩:未压缩的音频格式(例如WAV和AIFF)可提供出色的音质,但要付出高文件大小的代价。随着90年代中期互联网文件共享的兴起,人们很快意识到通过拨号连接发送未压缩的文件是不切实际的,而且常常是不可能的。这就是MP3(MPEG-2音频第III层)诞生的原因。一首三分钟的歌曲以WAV或AIFF格式平均需要30MB,而转换为MP3的那首歌曲则占用了十分之一的空间-仅约3MB。借助能够实现令人惊讶的小文件大小的压缩算法,MP3成为互联网时代的主要内容,并一直保持着强大的地位。
.m4a有损压缩:M4A(MPEG-4第14部分)文件是Apple对MP3的回应。这种以Mac为中心的压缩音频格式通常被视为MP3的继任者,随着iTunes Store的诞生,它找到了真正的位置,在iTunes Store中,它成为通过在线音乐商店购买的所有音乐的主要格式。对于Mac和iOS App Store以及Nintendo和PlayStation产品中发布的应用程序中包含的所有音频,它仍然是首选格式。随着越来越多的开发人员(包括对M4A的支持),它已迅速成为压缩音频文件的首选音频格式。M4A文件使用有损高级音频编码(AAC)编解码器进行编码,该编解码器能够提供与MP3相同的比特率,但压缩效果更严格。这样可以减小文件大小,同时提供更高的音频质量。就像金色的独角兽一样,这就是为什么它成为轻量级音频交付的如此流行的格式的原因。
主流视频编码:H.264、H.265、MPEG4、FLV
MPEGI(VCD)
MPEG2(DVD)
MPEG4(divx, xvid)
MPEG4 AVC/h.264
H.261
H.262
H.263
H.263+
H.263++
MPEG4 v1/v2/v3(微软 windows media系列)
Windows Media Video 7/8/9/10
Sorenson Video3(用于QT5,成标准了)( apple series)
Real Video G2(real media series)
RealVideo 8/9/10(real media series)
Apple MPEG-4(apple series)
Apple H.264(apple series)
flash video
视频容器格式:淘汰的就不说了、当前主流的有:mp4、wmv、avi、rvmb、wkv、flv、webm、mov、m4v
视频格式mkv、mp4、avi、flv、mov、wmv、webm特点和区别
m4v和mp4两种格式的区别
M4V 是一个标准视频文件格式,由苹果公司创造。此种格式为 iPod 、 iPhone 和 PlayStation Portable 所使用,同时此格式基于 MPEG-4 编码第二版。其视频编码采用H264或H264/AVC,音频编码采用AAC。采用H264高清编码,相比于传统On2 VP6、H263、Divx等,能够以更小的体积实现更高的清晰度。 M4V格式也称作苹果的视频Podcast 格式。是MP4的特殊类型,M4V是MP4格式高清的代表应用
MP4是一套用于音频、视频信息的压缩编码标准,由国际标准化组织(ISO)和国际电工委员会(IEC)下属的“动态图像专家组”(Moving Picture Experts Group,即MPEG)制定,第一版在1998年10月通过,第二版在1999年12月通过。MPEG-4格式的主要用途在于网上流、光盘、语音发送(视频电话),以及电视广播
如果我们不是专业搞影视类的,不用考虑太多容器格式,从后端、移动端、前端开发角度来说,考虑多端兼容和通用,优先选择多端能够兼容的通用编码和容器格式,HTML5目前只支持:MP4、WebM、Ogg
对于前端来说、还要考虑浏览器兼容性问题,请看html5 video标签详解,现在很多主流音视频相关企业用的都是mp4, m4v,m4a
苹果公司iPhone、iPad等,目前用的是 m4a、m4v、mp4、mov、wav格式, 苹果官方多媒体开发文档
安卓也支持
音乐和音效等场景一般使用wav、mp3编码,音质好、大量软件支持, 目前m4a更优秀,MP3的替代者,点击查看;
在视频应用场景中,一般用mpeg4 和 H.264标准来做编码,如果要支持4k等超高清之类的就用H.265编码。在视频中的音轨编码一般用AAC编码更适合;
在语音聊天场景中一般是用ogg编码;
所以我们当下选择的通用支持跨平台、应用更广泛的标准:音频使用m4a,ogg, 视频使用mp4 , m4v
音频编码格式详解:
AAC(Advanced Audio Coding)
高级音频编码是一种非常常见音频编码格式,出现于1997年,基于MPEG2的音频编码技术。由 Fraunhofer IIS、杜比实验室、AT&T、Sony(索尼)等公司共同开发,目的是取代MP3格式2000年,MPEG-4标准出现后,AAC重新集成了其特性,加入了SBR技术和PS技术,为了区别于传统的MPEG-2 AAC又称为MPEG-4 AAC。相关的规范标准分别是 ISO/IEC13818-7, ISO/IEC14496-3作为一种高压缩比的音频压缩算法,AAC压缩比通常为18:1,也有数据说为20:1,远胜mp3;
在音质方面,由于采用多声道,和使用低复杂性的描述方式,使其比几乎所有的传统编码方式在同规格的情况下更胜一筹。AAC可以支持多达48个音轨,15个低频(LFE)音轨,51多声道支持,更高的采样率(最高可达96kH,音频CD为441kH)和更高的采样精度(支持8it、16it、24bit、3bi,音频CD为16t)以及有多种语言的兼容能力,更高的解码效率,一般来说,AC可以在对比MP3文件缩小30%的前提下提供更好的音质AAC包含了如下9种规格:
1.MPEG2 AAC LC低复杂度规格( Low Complexity)
2.MPEG2 AAC Main主规格
3.MPEG2 AAC SSR可变采样率规格( Scaleable Sample Rate)
4.MPEG-4 AAC LC低复杂度规格( Low Complexity),现在的手机比较常见的MP4文件中的音频部份就包括了该规格音频文件
5.MPEG4 AAC Main主规格
6.MPEG4 AAC SSR可变采样率规格( Scaleable Sample Rate)
7.MPEG4 AAC LTP长时期预测规格( Long Term Predicition)
8.MPEG-4 AAC LD低延迟规格( Low Delay)
9.MPEG4 AAC HE高效率规格( High Efficiency)
AC-3(Digital Audio Compression Standard)、Revision A(ATSC Doc. A/52A)
音频编码格式,传说中的杜比实验室的杰作,著名的有损数据压缩的多媒体储存格式。可以包括多达6个独立的声道。最知名的是5.1声道技术。在5.1声道技术中,5代表着5个基本声道,独立连接至五个不同的喇叭(20至2000Hz),分别是右前(RF),中(C),左前(LF),右后(RR),左后(LR);而1则代表1个低频声效,连接至低音辅助喇叭(20至120Hz)每个AC-3的音频帧都是以0x0B77为同步头。开源库解码库liba52。
ALAC(Apple Lossless Audio Codec)
苹果的无损音频压缩编码格式,ALAC与MP3的主要分别在于编码过程中,MP3会取消小部分高频及低频部分的音频数据,而ALAC则会如实记录,不会删除音频中任何细节数据。由于资料无损,ALAC音频文件大小会比MP3大,通常每片音乐CD(约70至80分钟)经ALAC编码后,音频文件大小约300MB。
AMR( Adaptive Multi-Rate)自适应多速率音频压缩
音频编码格式,是一个使语音编码最优化的专利。AMR被标准语音编码3GP在1998年10月选用,现在广泛在GSM和UMTS中使用。它使用1-8个不同的位速编码。之前的手机里有很多amr的音频文件,可分成:
1.AMR-NB
2.AMR-WB, Adaptive Multi-Rate -Wideband Speech Codec
3.AMR-WB+, Extended Adaptive Multi-Rate -Wideband Speech Codec
ATRAC (Adaptive Transform Acoustic Coding)
是Sony公司开发的一种相对老的音频编码格式,又细分成 ATRACI、 ATRAC2、ATRAC3、 ATRAC3plus,这些都是独立的技术,后来Sony把这些技术统称为ATRAC。在rmvb的封装格式中也能看到这种音频编码格式。
APE
APE是 Monkey's Audio提供的一种无损压缩格式APE可以无损失高音质地压缩和还原。APE的压缩率相当高,并且音质保持得很好获得了不少发烧用户的青睐
DTS(Digital Theater Systems)
大名鼎鼎的DTS(数码影院系统)是由DTS公司开发,一种多通道的音频技术,低损,环绕立体声,被广泛的应用在DVD等高清片源上。同样也需要授权,与杜比公司是竞争对手。最常见的是DTS5.1:保存5条音频通道的数据用于环绕立体声分别是 center, left-front, right-front, left-rear, and right-rear除此之外DTS公司还开发了DTS70mm、DTS70ES、 DTS NEO:6、DTS9624、 DTS-HD MasterAudio、 DTS-HD High Resolution Audio、 DTS Connect、 DTS Surround Sensation等技术。由于版权比较严格,而且文档很难从网上找到。
FLAC(Free Lossless Audio Codec)
是一款开源的无损压缩的音频编码格式,它不会破坏任何原有的音频资讯,所以可以还原音乐光碟音质。现在它已被很多软件及硬件音频产品所支持,FLAC计划首页http://flac.sourceforge.net/
MP3(MPEG-1 or MPEG-2 Audio Layer III)
MPEG1 or MPEG2 Audio LayerⅢ经常被称作MP3,是目前最流行的音频编码格式,有损压缩,相关的规范标准在 ISO/EC11723, ISOAIEC13818-3。它是在1991年,由位于德国埃尔朗根的研究组织 Fraunhofer-Gesellschaft的一组工程师发明和标准化的,它设计用来大幅度地降低音频数据量,将音乐以1:10甚至1:12的压缩率,压缩成容量较小的文件。
bit rates对MP3来说是可变的,原则是 bit rates越高声音文件中包含的原始声音信息越多,这样回放时声音品质也越高。
就 bit rates来说MP3可以分为2种
MP3CBR: Constant Bit Rate在MP3编码的早期,整个文件使用一个固定的位元率
MP3VBR: Variable Bit Rate可以让MP3文件的每一段甚至每一帧都可以有单独的 bitrate,这样做的好处就是在保证音质的前提下最大程度的限制了文件的大小。这个方法类似于声音控制的磁带录音机不记录静止部分节省磁带消耗。
Ogg
Ogg是一个自由且开放标准的容器格式,由 Xiph. org基金会所维护,“ogg意指种文件格式,可以纳入各式各样自由和开放源代码的编解码器,包含音效、视频、文字(像字幕)与元数据的处理。
1 Ogg_vorbis:这就是咱们常见的ogg结尾的音频文件, Vorbis是一种有损音讯压缩格式,由 Xiph。 Org基金会所领导并开放源代码。 Vorbis通常以ogg作为容器格式,所以常合称为 Ogg Vorbis
PCM (Pulse Code Modulated Audio)
目前计算机应用中,最高保真水平的音频编码格式。PCM约定俗成了无损编码能做到最大程度的无限接近绝对保真。被广泛用于素材保存及音乐欣赏,CD、DVD以及我们常见的WAV文件中均有应用,优点是音质好,缺点是体积大。做嵌入式音视频产品时,一般情况的音视频都是芯片负责解码。如果遇到版权问题,例如AC3DTS,有些时候芯片厂商要求很严格,用户会采取软解的方法,软解也就是把AC3 DTS等音频解成PCM,然后在送给芯片。
RealAudio
网络中非常常见,在rmvb、rm封装格式中,或者是 .ra .ram音频文件,由RealNetworks发展的一种多媒体音频文件格式,目前已有很多版本:
1、lpc, 14-4: IS-54 VSELP(RealAudio 1)
2、28-8: G728 LD-CELP (RealAudio 2)
3、dnet: Dolby AC3(RealAudio 3)
4、sipr: Sipro Lab Telecom ACELP-NET(RealAudio 4/5)
5、cook: G2/Cook Codec(RealAudio 6)
6、atrc: Sony ATRAC3(RealAudio 8)
7、raac: MPEG-4 LC-AAC (RealAudio 9)
8、racp: MPEG-4 HE-AAC (RealAudio 10)
9、ralf: RealAudio Lossless Format( RealAudio 10)
WMA (Windows Media Audio)
是微软公司开发的一种数字音频压缩格式,WMA7之后的WMA支持证书加密,未经许可(即未获得许可证书),即使是非法拷贝到本地,也是无法收听的。目前比较流行的是WMA9:
WMA9, Windows Media 9 Audio Codec
WMA9 PRO, Windows Media 9 Professional Audio Codec
WMA9_ LL, Windows Media 9 Lossless Audio Codec