AV1 比特流&解码过程规范-术语和定义

草稿文件

这是一份文件草稿,在正式发布前将会有很大的变化。不要依赖它当前的内容。

1.范围

本文档指定开放媒体联盟AV1编解码器比特流格式和解码过程。

2.术语和定义

AC coefficient

任何频域索引在至少一个维度上为非零的变换系数

Altref

(Alternative reference frame)能在帧间编码中使用的帧

Base layer

spatial_id和temporal_id都等于0的层

Bitstream

由编码帧序列产生的比特序列

Bit string

比特数目有限的有序字符串,最左边的位是MSB,最右边的位是LSB

Block

由一个亮度和两个色度矩阵组成的正方形或长方形像素区域

Block scan

量化系数的指定顺序

Byte

一个8位比特串

Byte alignment

一个位相较于比特流开始的位置是8的整数倍那么这个位就是字节对齐的

CDEF

(Constrained Directional Enhancement Filter)设计用来基于识别方向的自适应过滤块

CDF

(Cumulative distribution function)表示一个符号的值小于等于给定水平的概率乘以32768

Chroma

两个色差信号中的一个样点值或者一个样点矩阵,色度符号是U和V

Coded frame

表示进行解码之前的一个帧

Component

亮度或者两个色度矩阵中的一个矩阵,也可以表示它的一个样点值

Compound prediction

通过将两个参考帧的预测混合在一起来计算样点值的一种帧间预测类型

DC coefficient

一个变换系数,其频域索引在两个维度都为零

Decoded frame

由解码器在比特流中重建的帧

Decoder

解码过程的一个具体实现

Decoding process

从句法元素推导解码帧的过程

Dequantization

通过对量子化系数的缩放来获得变换系数的过程

Encoder

编码过程的一个具体实现

Encoding process

生成符合本文档描述的比特流,但是具体过程没有在本规范中指定。

Enhancement layer

spatial_id或者temporal_id大于0的层

Flag

一个二值变量,突出显示句法元素只能等于0或者等于1

Frame

视频信号在空间域中的表示,由一个亮度矩阵(Y)和两个色度矩阵(UV)组成

Frame context

用在解码过程中的一系列概率

Frame buffer

一个存储已解码帧和相关信息的区域

Golden frame

在帧间编码中可以使用的帧,通常情况下,golden frame编码的质量更高,并被用作多个帧间帧的参考

Inter coding

用帧间预测编码一个块或者一个帧

Inter frame

通过参考先前解码帧压缩的帧,可以使用帧内预测或者帧间预测

Inter prediction

利用先前的解码帧,推导出当前帧的预测值的过程

Intra coding

用帧内预测编码一个块或者一个帧

Intra frame

一种只使用帧内预测的帧,可以独立解码

Intra prediction

在同一解码帧中,利用先前解码的样点值,推导出当前样点预测值的过程

Inverse transform

将变换系数矩阵转化为空间样点值矩阵的过程(得到残差系数)

Key frame

一个帧内帧,当它出现时重置解码过程

Layer

一系列具有相同spatial_id和temporal_id的片组OBUs

Level

对句法元素和变量值定义的一组约束

Loop filter

一种用于重建帧的过滤过程,旨在减少块效应

Luma

一个样点值矩阵或单个样点值,表示与主色相关的单色信号,符号用Y表示

Mode info

在解码过程中,包含指示块如何被预测的块的语法元素

Mode info block

一个大小为4x4或者更大的亮度样点值块,以及它的两个相应的色度样点值块(如果存在的话)

Motion vector

一个二维矢量,用于将当前帧引用到参考帧,它的值提供了从当前帧的位置到参考帧中位置的坐标偏移量

OBU

所有句法结构封包在“开放比特流单元”中,每个OBU都有一个头,它为包含的数据(有效负载)提供标识信息

Parse

从比特流中获取句法元素的过程

Prediction

预测过程的实现,包括帧内预测和帧间预测

Prediction process

用预测器估计解码样点值或数据元素的过程

Prediction value

值,即之前解码的样点值或数据元素的组合,用于下一个样点值或数据元素的解码过程

Profile

部分句法、语义和算法的子集

Quantization parameter

用于在解码过程中缩放量化系数的变量

Quantized coefficient

反量化之前的变换系数

Raster scan

(光栅扫描)将二维矩形光栅映射为一维光栅,其中一维光栅的入口从二维光栅的第一行开始,然后扫描进入第二行和第三行,以此类推。每个行从左到右扫描

Reconstruction

解码获得的残差和对应的预测值相加

Reference frame

在帧间预测过程中使用的之前已解码的帧

Reserved

一种特殊的句法元素值,可以用来在将来扩展这个部分

Residual

重建值和对应的预测值的差

Sample

构成帧的基本元素

Sample value

样点的值,对8位帧来说,这是一个0~255的整数;对于10位帧来说,这是一个0~1023的整数;对于12位帧来说,这是一个0~4095的整数

Segmentation map

一个3bit的数字包含了图像中每个4x4块的段关系,每一个参考缓存存储了一个段映射允许新的帧使用之前的已编码映射

Sequence

编码比特流的最高层次句法结构,包括一个或几个连续编码的帧

Superblock

一个tile中块四叉树的最高层次,一个帧中所有超级块大小都是一样的并且都是正方形,超级块可以是128x128像素或者64x64像素,一个超级块可以包含1或2个模式信息块,或者可以在每个方向上平分,创建4个子块,这些子块本身可以被进一步细分,形成块四叉树

Switch Frame

一个帧间编码帧可以作为序列切换的点,在不强制使用帧内编码的情况下,切换帧会覆盖所有的帧缓冲区。其目的是允许一个流用例,其中视频可以被编码成小块(比如1秒的时间),每一个都以一个切换帧开始。如果可用带宽下降,服务器可以开始从较低的比特率编码中发送块,切换后的解码图像可能有点不正确,但是这种方法允许一个切换,而不需要一个完整的关键帧的成本

Syntax element

在比特流中表示的数据元素

Temporal delimiter OBU

指示接下来的OBUs相对于时间分隔符之前的最后一帧有不同的显示/解码时间戳

Temporal unit

它由一个时间分隔符OBU和所有跟随的OBUs组成,但不包括下一个时间分隔符

Temporal group

一组帧,其时间预测结构在视频序列中周期性地使用

Tile

帧的一个矩形区域,可以独立的解码和编码,尽管跨tile边缘的环路滤波仍然适用

Transform block

一种正方形变换系数矩阵,用于反变换过程的输入

Transform coefficient

频域中的一个标量值,包含在一个变换块中

Uncompressed header

解码帧的高级描述,编码的时候没有用算术编码

posted @ 2018-05-02 09:39  寒山飘雪  阅读(2439)  评论(0编辑  收藏  举报