DoubleLi

qq: 517712484 wx: ldbgliet

  博客园 :: 首页 :: 博问 :: 闪存 :: 新随笔 :: 联系 :: 订阅 订阅 :: 管理 ::
  4737 随笔 :: 2 文章 :: 542 评论 :: 1615万 阅读
< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

RTMP推送的音视频流的封装形式和FLV格式相似,由此可知,向FMS推送H264和AAC直播流,需要首先发送"AVC sequence header"和"AAC sequence header",这两项数据包含的是重要的编码信息,没有它们,解码器将无法解码。

  AVC sequence header就是AVCDecoderConfigurationRecord结构,该结构在标准文档“ISO-14496-15 AVC file format”中有详细说明。

    

  AAC sequence header存放的是AudioSpecificConfig结构,该结构则在“ISO-14496-3 Audio”中描述。AudioSpecificConfig结构的描述非常复杂,这里我做一下简化,事先设定要将要编码的音频格式,其中,选择"AAC-LC"为音频编码,音频采样率为44100,于是AudioSpecificConfig简化为下表:

    

  这样,AVC sequence header和AAC sequence header的内容可以基本确定了,更详细的信息,大家可以去翻阅相关文档。

在发送这两个header需要在前面分别加上 VideoTags、AudioTags  这连个tags都是1个字节(8bits)的数据

其中AudioTags每bit表示的意义如下图:

其中SoundData 的组成如下:

当数据的第一个字节为0时,后面跟AAC sequence header;

当数据的第一个字节为1时,后面跟AAC 数据;

其中VideoTags每bit表示的意义如下图:

发送的为avc数据,所以,CodecID(后4bit)的值为7

所以videodata的数据打包方式为 ,具体的信息见下图:

具体代码实现:

//添加Flv的VideoTags
char* RtmpLiveEncoder::AddVideoTags(char* buf,bool isKeyframe)
{
//前面4字节表示FrameType,后面4字节表示CodecID
unsigned char flag = 0;
if (isKeyframe)
flag = 0x17;
else
flag = 0x27;


buf = UI08ToBytes(buf, flag);
buf = UI08ToBytes(buf, 1);    // avc packet type (0, nalu)  包的类型,同步包为0
buf = UI24ToBytes(buf, 0);    // composition time  0为打开,1为关闭


return buf;
}
//添加Flv的AudioTags
char* RtmpLiveEncoder::AddAudioTags(char* buf)
{
//
unsigned char flag = 0;
flag = (10 << 4) |  // soundformat "10 == AAC"
(3 << 2) |      // soundrate   "3  == 44-kHZ"
(1 << 1) |      // soundsize   "1  == 16bit"
1;              // soundtype   "1  == Stereo"


buf = UI08ToBytes(buf, flag); 
buf = UI08ToBytes(buf, 1);    // aac packet type (1, raw)  包的类型,同步包为0


return buf;
}

这两个函数返回的buf后面接需要发送的数据

 

from:https://blog.csdn.net/lcjatf/article/details/18001351

posted on   DoubleLi  阅读(3532)  评论(0编辑  收藏  举报
编辑推荐:
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
阅读排行:
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 单线程的Redis速度为什么快?
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
· 展开说说关于C#中ORM框架的用法!
历史上的今天:
2017-05-10 Windows录音API学习笔记--转
2017-05-10 Windows基础-实时录音程序(WaveXXX)
2017-05-10 Windows基础-使用XAudio2播放音频(本质是WASAPI)
2017-05-10 XAudio2播放PCM
2017-05-10 C++ 调节PCM音频音量大小
2017-05-10 C++ 采集音频流(PCM裸流)实现录音功能
2017-05-10 C++ 播放音频流(PCM裸流)--改善
点击右上角即可分享
微信分享提示