Flv的结构分析
Flv是网络上流行的非常广的一种媒体格式,很多大型媒体网站都在使用这种格式承载音视频信息,比如优酷等网站。
Flv文件格式相对而言还是比较简单的,主要是由两部分组成
FLV header
FLV body
FLV header
前9个字节
46 4c 56 01 05 00 00 00 00 09
第一到第三字节(46 4c 56) 的ascii的代码为"FLV"(注意大小写)
第四个字节为版本信息,一般都为(01)
第五个字节为流的信息,表示是否有视频信息,是否有音频信息。0000 0001(0x01)为有视频,0000 0100(0x04)为有音频,既有有视频又有音频为(0x05)
第六到第九字节存放的是整个头部长度,一般为(3+1+1+4)=9。
FLV body
Flv body是由很多tag组成,tag又分成三种类型
- script(脚本流)
- video(视频流)
- audio(音频流)
tag的结构举例如下:
每个tag包含
- tag header
-
tag data
tag header
tag header 的第一个字节表示为记录的数据类型,(0x12)为脚本类型;(0x08)为音频类型;(0x09)为视频类型
tag header的第二到第四个字节表示为数据区长度
(0x00 01 74)表示 为372,表示tag data 长度
tag header 的第五到第七个字节表示为时间戳,类型为(0x12)的tag时间戳一直为0,(0xFFFFFF)可以表示长度为4小时,单位为毫秒。
tag header 的第八个字节为扩展时间戳,一般都为0,长度为4小时的flv一般很少见了。
tag header 的第九到第十一个字节为streamID,总为0.
tag data
tag data三种类型的结构表示如下:
script(脚本流)
包含两个AMF(Action Message Format)包,第一个AMF包封装了" onMetaData ",第二个AMF包封装了诸如视频图像长宽,文件长度,视频帧率,音频比特率,位深等等。
第一个字节表示AMF包类型,都是(0x02),表示字符串。
第二到第三个字节表示字符串长度,一般是(0x0a),表示10个字符串,就是第四到第十三个字节包含的" onMetaData "字符串的长度。
第十四个字节是第二个AMF包类型,一般是(0x08),表示数组,第十五到第十八个字节是AMF包长度,表示数组元素个数。(0x10)表示包含16个数组元素长度。
后面即为各数组元素的封装,数组元素为元素名称和值组成的对。表示方法如下:
第1-2个字节表示元素名称的长度,假设为L。
后面跟着为长度为L的字符串。
第L+3个字节表示元素值的类型。
后面跟着为对应值,占用字节数取决于值的类型。
video(视频流)
视频流如下:
前4bits表示类型:
·1-- keyframe
·2 -- inner frame
·3 -- disposable inner frame (h.263 only)
·4 -- generated keyframe
(0x17)前4bit表示为0001,表示为keyframe
后4bits表示解码器ID:
·2 -- seronson h.263
·3 -- screen video
·4 -- On2 VP6
·5 -- On2 VP6 with alpha channel
·6 -- Screen video version 2
·7 -- AVC (h.264)
(0x17)后4bits表示为0111,表示为avc(h.264)
第二个字节表示为(AVCPacketType),如果数据块为如果是视频配置信息,固定为0x00,如果数据块是社频数据,固定为0x01。
之后是视频数据。
audio(音频流)
前4bits表示音频格式:
·0 -- 未压缩
·1 -- ADPCM
·2 -- MP3
·4 -- Nellymoser 16-kHz mono
·5 -- Nellymoser 8-kHz mono
·10 – AAC
(0x2b)前4bits为2,表示为mp3
下面两个bits表示samplerate:
·0 -- 5.5KHz
·1 -- 11kHz
·2 -- 22kHz
·3 -- 44kHz
(0x2b)中b表示为 1011,10为2,表示22kHz
下面1bit表示采样长度:
·0 -- snd8Bit
·1 -- snd16Bit
下面1bit表示类型:
·0 -- sndMomo
·1 – sndStereo
之后是数据。
tag size
在每个tag前面都有四个字节,表示前面tag的长度大小,因为script(脚本流)前面没有tag,所以script tag前面的四个字节都为(0x00 00 00 00).
相应的入门代码 传送门: