使用FFMPEG类库分离出多媒体文件中的H.264码流
在使用FFMPEG的类库进行编程的过程中,可以直接输出解复用之后的的视频数据码流。只需要在每次调用av_read_frame()之后将得到的视频的AVPacket存为本地文件即可。
经试验,在分离MPEG2码流的时候,直接存储AVPacket即可。
在分离H.264码流的时候,直接存储AVPacket后的文件可能是不能播放的。
如果视音频复用格式是TS(MPEG2 Transport Stream),直接存储后的文件是可以播放的。
复用格式是FLV,MP4则不行。
经过长时间资料搜索发现,FLV,MP4这些属于“特殊容器”,需要经过以下处理才能得到可播放的H.264码流:
1.第一次存储AVPacket之前需要在前面加上H.264的SPS和PPS。这些信息存储在AVCodecContext的extradata里面。
并且需要使用FFMPEG中的名为"h264_mp4toannexb"的bitstream filter 进行处理。
然后将处理后的extradata存入文件
具体代码如下:(源码见最后)
FILE *fp=fopen("test.264","ab"); AVCodecContext *pCodecCtx=... unsigned char *dummy=NULL; //输入的指针 int dummy_len; AVBitStreamFilterContext* bsfc = av_bitstream_filter_init("h264_mp4toannexb"); av_bitstream_filter_filter(bsfc, pCodecCtx, NULL, &dummy, &dummy_len, NULL, 0, 0); fwrite(pCodecCtx->extradata,pCodecCtx-->extradata_size,1,fp); av_bitstream_filter_close(bsfc); free(dummy);
2.通过查看FFMPEG源代码我们发现,AVPacket中的数据起始处没有分隔符(0x00000001), 也不是0x65、0x67、0x68、0x41等字节,所以可以AVPacket肯定这不是标准的nalu。其实,AVPacket前4个字表示的是nalu的长度,从第5个字节开始才是nalu的数据。所以直接将AVPacket前4个字节替换为0x00000001即可得到标准的nalu数据。
具体代码如下:
char nal_start[]={0,0,0,1}; fwrite(nal_start,4,1,fp); fwrite(pkt->data+4,pkt->size-4,1,fp); fclose(fp);
经过以上两步处理之后,我们就得到了可以正常播放的H.264码流。
3.ffmpeg中提供了一个流过滤器"h264_mp4toannexb"完成这项工作(从extradata中解析出sps及pps),关键代码如下:
1 //h264_mp4toannexb_bsf.c 2 static int h264_mp4toannexb_filter(AVBitStreamFilterContext *bsfc, 3 AVCodecContext *avctx, const char *args, 4 uint8_t **poutbuf, int *poutbuf_size, 5 const uint8_t *buf, int buf_size, 6 int keyframe) { 7 H264BSFContext *ctx = bsfc->priv_data; 8 uint8_t unit_type; 9 int32_t nal_size; 10 uint32_t cumul_size = 0; 11 const uint8_t *buf_end = buf + buf_size; 12 13 14 /* nothing to filter */ 15 if (!avctx->extradata || avctx->extradata_size < 6) { 16 *poutbuf = (uint8_t*) buf; 17 *poutbuf_size = buf_size; 18 return 0; 19 } 20 21 // 22 //从extradata中分析出SPS、PPS 23 // 24 /* retrieve sps and pps NAL units from extradata */ 25 if (!ctx->extradata_parsed) { 26 uint16_t unit_size; 27 uint64_t total_size = 0; 28 uint8_t *out = NULL, unit_nb, sps_done = 0, sps_seen = 0, pps_seen = 0; 29 const uint8_t *extradata = avctx->extradata+4; //跳过前4个字节 30 static const uint8_t nalu_header[4] = {0, 0, 0, 1}; 31 32 33 /* retrieve length coded size */ 34 ctx->length_size = (*extradata++ & 0x3) + 1; //用于指示表示编码数据长度所需字节数 35 if (ctx->length_size == 3) 36 return AVERROR(EINVAL); 37 38 39 /* retrieve sps and pps unit(s) */ 40 unit_nb = *extradata++ & 0x1f; /* number of sps unit(s) */ 41 if (!unit_nb) { 42 goto pps; 43 } else { 44 sps_seen = 1; 45 } 46 47 48 while (unit_nb--) { 49 void *tmp; 50 51 52 unit_size = AV_RB16(extradata); 53 total_size += unit_size+4; 54 if (total_size > INT_MAX - FF_INPUT_BUFFER_PADDING_SIZE || 55 extradata+2+unit_size > avctx->extradata+avctx->extradata_size) { 56 av_free(out); 57 return AVERROR(EINVAL); 58 } 59 tmp = av_realloc(out, total_size + FF_INPUT_BUFFER_PADDING_SIZE); 60 if (!tmp) { 61 av_free(out); 62 return AVERROR(ENOMEM); 63 } 64 out = tmp; 65 memcpy(out+total_size-unit_size-4, nalu_header, 4); 66 memcpy(out+total_size-unit_size, extradata+2, unit_size); 67 extradata += 2+unit_size; 68 pps: 69 if (!unit_nb && !sps_done++) { 70 unit_nb = *extradata++; /* number of pps unit(s) */ 71 if (unit_nb) 72 pps_seen = 1; 73 } 74 } 75 76 77 if(out) 78 memset(out + total_size, 0, FF_INPUT_BUFFER_PADDING_SIZE); 79 80 81 if (!sps_seen) 82 av_log(avctx, AV_LOG_WARNING, "Warning: SPS NALU missing or invalid. The resulting stream may not play.\n"); 83 if (!pps_seen) 84 av_log(avctx, AV_LOG_WARNING, "Warning: PPS NALU missing or invalid. The resulting stream may not play.\n"); 85 86 87 av_free(avctx->extradata); 88 avctx->extradata = out; 89 avctx->extradata_size = total_size; 90 ctx->first_idr = 1; 91 ctx->extradata_parsed = 1; 92 } 93 94 95 *poutbuf_size = 0; 96 *poutbuf = NULL; 97 do { 98 if (buf + ctx->length_size > buf_end) 99 goto fail; //buf为NULL时,以下代码将不再执行 100 101 102 // 103 //用于保存数据长度的字节数,是在分析原extradata计算出来的 104 // 105 if (ctx->length_size == 1) { 106 nal_size = buf[0]; 107 } else if (ctx->length_size == 2) { 108 nal_size = AV_RB16(buf); 109 } else 110 nal_size = AV_RB32(buf); 111 112 113 buf += ctx->length_size; 114 unit_type = *buf & 0x1f; 115 116 117 if (buf + nal_size > buf_end || nal_size < 0) 118 goto fail; 119 120 121 /* prepend only to the first type 5 NAL unit of an IDR picture */ 122 if (ctx->first_idr && unit_type == 5) { 123 // 124 //copy IDR 帧时,需要将sps及pps一同拷贝 125 // 126 if (alloc_and_copy(poutbuf, poutbuf_size, 127 avctx->extradata, avctx->extradata_size, 128 buf, nal_size) < 0) 129 goto fail; 130 ctx->first_idr = 0; 131 } else { 132 // 133 //非IDR帧,没有sps及pps 134 if (alloc_and_copy(poutbuf, poutbuf_size, 135 NULL, 0, 136 buf, nal_size) < 0) 137 goto fail; 138 if (!ctx->first_idr && unit_type == 1) 139 ctx->first_idr = 1; 140 } 141 142 143 buf += nal_size; 144 cumul_size += nal_size + ctx->length_size; 145 } while (cumul_size < buf_size); 146 147 148 return 1; 149 150 151 fail: 152 av_freep(poutbuf); 153 *poutbuf_size = 0; 154 return AVERROR(EINVAL); 155 }
一般情况下,extradata中包含一个sps、一个pps 的nalu, 从上面的代码中容易看出extradata的数据格式。分析后的sps及pps依然储存在extradata域中,并添加了起始符。从代码中还可以看出,上面的函数会将sps、pps及packet中的数据,都copy到poutbuf指示的内存中,如果不需要copy到指定内存,直接给buf参数传入空值即可。