FFmpeg 音视频同步
原地址:http://www.jianshu.com/p/27279255f67e
音视频播放器的工作的具体流程如下图所示:
简单的来说包括:解协议,解封装,对音频和视频分别进行解码,音视频同步播放这几个部分,各部分详细解释请看后面参考资料。由于我们是分别解码和播放音频和视频的,所以各自播放的节奏需要同步,否则会出现音画不一致的情况。本文主要介绍一个简单的音视频同步的方案。
准备工作
相关知识
- PTS和DTS
音视频流中的每一帧都有时间相关的信息,其中PTS是播放时间,DTS是解码时间。音频的PTS和DTS是一致的,而某些视频各种中可能会存在DTS和PTS不一致的帧,我们这里主要通过PTS来控制播放时间。对解码后的AVFrame使用av_frame_get_best_effort_timestamp可以获取PTS。 - time_base
我们注意到PTS是一个整形数据,time_base是PTS的单位,PTS乘以time_base即可得到实际时间。只有AVStream中获取的time_base才是对的,其他地方获取的可能会有问题。 - 音视频同步策略
一般来说有三种方式,音频同步到视频,视频同步到音频,音视频同步到外部时间。一般各个参数设置正确音频就能够以正常的速度播放,所以把视频同步到音频在一般情况下,是一个简单有效的同步策略。本文主要采取这个方式同步音视频,来展示相关的基本思路。
同步视频到音频
- 获取解码的视频帧时间。
AVFrame vFrame; AVStream vStream; //...解析视频获取vStream,解码视频帧获得vFrame... double timestamp = av_frame_get_best_effort_timestamp(&vFrame)*av_q2d(vStream->time_base);
- 获取解码的音频帧时间。
AVFrame aFrame; AVStream aStream; //...将正在播放的音频时间点记录下来作为基准... audioClock = aFrame.pkt_pts * av_q2d(aStream->time_base);
- 音视频同步逻辑
/* no AV sync correction is done if below the minimum AV sync threshold */ #define AV_SYNC_THRESHOLD_MIN 0.04 /* AV sync correction is done if above the maximum AV sync threshold */ #define AV_SYNC_THRESHOLD_MAX 0.1 /* If a frame duration is longer than this, it will not be duplicated to compensate AV sync */ #define AV_SYNC_FRAMEDUP_THRESHOLD 0.1 /* no AV correction is done if too big error */ #define AV_NOSYNC_THRESHOLD 10.0 double timestamp; //判断是否有有效的pts if(packet.pts == AV_NOPTS_VALUE) { timestamp = 0; } else { timestamp = av_frame_get_best_effort_timestamp(&vFrame)*av_q2d(vStream->time_base); } //计算帧率,平均每帧间隔时间 double frameRate = av_q2d(vStream->avg_frame_rate); frameRate += vFrame.repeat_pict * (frameRate * 0.5); if (timestamp == 0.0) { //按照默认帧率播放 usleep((unsigned long)(frameRate*1000)); }else { if (fabs(timestamp - audioClock) > AV_SYNC_THRESHOLD_MIN && fabs(timestamp - audioClock) < AV_NOSYNC_THRESHOLD) { //如果视频比音频快,延迟差值播放,否则直接播放,这里没有做丢帧处理 if (timestamp > audioClock) { usleep((unsigned long)((timestamp - audioClock)*1000000)); } } }