FFmpeg学习:FFmpeg入门(零声教育课件内容)

ffmpeg库简介

ffmpeg整体架构

结构

ffmpeg的8个常用库

  • AVUtil:核心工具库,下面的许多其他模块都会依赖该库做一些基本的音视频处理操作。
  • AVFormat:文件格式和协议库,该模块是最重要的模块之一,封装了Protocol层和Demuxer、Muxer层,使得协议和格式对于开发者来说是透明的。
  • AVCodec:编解码库,封装了Codec层,但是有一些Codec是具备自己的License的,FFmpeg是不会默认添加像libx264、FDK-AAC等库的,但是FFmpeg就像一个平台一样,可以将其他的第三方的Codec以插件的方式添加进来,然后为开发者提供统一的接口。
  • AVFilter:音视频滤镜库,该模块提供了包括音频特效和视频特效的处理,在使用FFmpeg的API进行编解码的过程中,直接使用该模块为音视频数据做特效处理是非常方便同时也非常高效的一种方式。
  • AVDevice:输入输出设备库,比如,需要编译出播放声音或者视频的工具ffplay,就需要确保该模块是打开的,同时也需要SDL的预先编译,因为该设备模块播放声音与播放视频使用的都是SDL库。
  • SwrRessample:该模块可用于音频重采样,可以对数字音频进行声道数、数据格式、采样率等多种基本信息的转换。
  • SWScale:该模块是将图像进行格式转换的模块,比如,可以将YUV的数据转换为RGB的数据,缩放尺寸由1280720变为800480。
  • PostProc:该模块可用于进行后期处理,当我们使用AVFilter的时候需要打开该模块的开关,因为Filter中会使用到该模块的一些基础函数

ffmpeg函数简介

初始化相关
  • av_register_all():注册所有组件,4.0已经弃用
  • avdevice_register_all():对设备进行注册,比如V4L2等。
  • avformat_network_init():初始化网络库以及网络加密协议相关的库(比如openssl)
封装格式相关

avformat_alloc_context();负责申请一个AVFormatContext
结构的内存,并进行简单初始化

  • avformat_free_context():释放该结构里的所有东西以及该结构本身
  • avformat_close_input():关闭解复用器。关闭后就不再需要使用avformat_free_context 进行释放。
  • avformat_open_input():打开输入视频文件
  • avformat_find_stream_info():获取视频文件信息
  • av_read_frame():读取音视频包
  • avformat_seek_file():定位文件
  • av_seek_frame():定位文件
    封装格式相关函数
解码器相关
  • avcodec_alloc_context3():分配解码器上下文
  • avcodec_find_decoder():根据ID查找解码器
  • avcodec_find_decoder_by_name():根据解码器名字
  • avcodec_open2():打开编解码器
  • avcodec_decode_video2():解码一帧视频数据(FFmepg 4以后版本已经将该API丢弃,需要新的API接口代替)
  • avcodec_decode_audio4():解码一帧音频数据(FFmepg 4以后版本已经将该API丢弃,需要新的API接口代替)
  • avcodec_send_packet():发送编码数据包
  • avcodec_receive_frame():接收解码后数据
  • avcodec_free_context():释放解码器上下文,包含了
  • avcodec_close()
  • avcodec_close():关闭解码器
    编解码器

ffmpeg 组件注册方式

参考:组件注册

不同版本的FFmpeg,组件注册方式还稍微有些不一样。3.x版本需要用户调用API函数完成注册操作;4.x版本开始,无需要用户调用API进行注册。

1、FFmpeg 3.x组件注册方式

3.x版本使用ffmpeg,先要执行 av_register_all(4.0后已弃用),把全局的解码器、编码器等结构体注册到各自全局的对象链表里,以便后面查找调用。
3.x

2、FFmpeg 4.x组件注册方式

ffmpeg内部做的注册,不需要用户调用API完成注册。

以codec编解码器为例:

  • 1)在configure的时候生成要注册的组件 ./configure:7203:print_enabled_components libavcodec/codec_list.c AVCodec codec_list $CODEC_LIST 这里会生成一个codec_list.c 文件,里面只有static const AVCodec *const codec_list[]数组。
  • 2)在libavcodec/allcodecs.c将 static const AVCodec * const codec_list[] 的编解码器用链表的方式组织起来。

3、FFmpeg 4.0.2 组件注册方式

ffmpeg内部做的注册,不需要用户调用API完成注册。

对于demuxer/muxer(解复用器,也称容器)则对应:

  • 1)libavformat/muxer_list.c,libavformat/demuxer_list.c 这两个文件也是在configure的时候生成,也就是说直接下载源码是没有这两个文件的。
  • 2)在libavformat/allformats.c将demuxer_list[]和muexr_list[]以链表的方式组织。

FFmpeg 数据结构介绍

  • AVFormatContext:封装格式上下文结构体,也是统领全局的结构体,保存了视频文件封装格式相关信息。
  • AVInputFormat demuxer:每种封装格式(例如FLV, MKV, MP4, AVI)对应一个该结构体。
  • AVOutputFormat muxer
  • AVStream:视频文件中每个视频(音频)流对应一个该结构体。
  • AVCodecContext:编解码器上下文结构体,保存了视频(音频)编解码相关信息。
  • AVCodec:每种视频(音频)编解码器(例如H.264解码器)对应一个该结构体。
  • AVPacket:存储一帧压缩编码数据。
  • AVFrame:存储一帧解码后像素(采样)数据。

AVFormatContext和AVInputFormat之间的关系

  • AVFormatContext API调用
  • AVInputFormat 主要是FFMPEG内部调用
    比较

AVCodecContext和AVCodec之间的关系

avcodec

AVFormatContext, AVStream和AVCodecContext之间的关系

av

区分不同的码流

AVPacket和AVFrame之间的关系

帧

数据结构分析

AVFormatContext
  • iformat:输入媒体的AVInputFormat,比如指向AVInputFormat ff_flv_demuxer
  • nb_streams:输入媒体的AVStream 个数
  • streams:输入媒体的AVStream []数组
  • duration:输入媒体的时长(以微秒为单位),计算方式可以参考av_dump_format()函数。
  • bit_rate:输入媒体的码率
AVInputFormat
  • name:封装格式名称
  • extensions:封装格式的扩展名
  • 一些封装格式处理的接口函数,比如read_packet()
AVStream

• index:标识该视频/音频流
• time_base:该流的时基,PTS*time_base=真正的时间(秒)
• avg_frame_rate: 该流的帧率
• duration:该视频/音频流长度
• codecpar:编解码器参数属性

AVCodecParameters

• codec_type:媒体类型AVMEDIA_TYPE_VIDEO/ AVMEDIA_TYPE_AUDIO等
• codec_id:编解码器类型, AV_CODEC_ID_H264/ AV_CODEC_ID_AAC等

AVCodecContext

• codec:编解码器的AVCodec,比如指向AVCodec
ff_aac_latm_decoder
• width, height:图像的宽高(只针对视频)
• pix_fmt:像素格式(只针对视频)
• sample_rate:采样率(只针对音频)
• channels:声道数(只针对音频)
• sample_fmt:采样格式(只针对音频)

AVCodec

• name:编解码器名称
• type:编解码器类型
• id:编解码器ID
• 一些编解码的接口函数,比如int (*decode)()

AVPacket

• pts:显示时间戳
• dts:解码时间戳
• data:压缩编码数据
• size:压缩编码数据大小
• pos:数据的偏移地址
• stream_index:所属的AVStream,1表示音频,0表示视频

AVFrame

• data:解码后的图像像素数据(音频采样数据)
• linesize:对视频来说是图像中一行像素的大小;对音频来说是
整个音频帧的大小
• width, height:图像的宽高(只针对视频)
• key_frame:是否为关键帧(只针对视频) 。
• pict_type:帧类型(只针对视频) 。例如I, P, B
• sample_rate:音频采样率(只针对音频)
• nb_samples:音频每通道采样数(只针对音频)
• pts:显示时间戳

SDL简介

作用:SDL(Simple DirectMedia Layer)库的作用主要是封装了复杂的视音频底层交互工作, 简化了视音频处理的难度。

SDL结构如下所示。可以看出它实际上还是调用了DirectX等底层的API完成了和硬件的交互

SDL

参考文献

新老对照API的整理

posted @ 2022-07-13 11:15  小超不挑食  阅读(1322)  评论(0编辑  收藏  举报