YUV颜色编码

Posted on 2011-12-13 14:35  无忧consume  阅读(1076)  评论(0编辑  收藏  举报

YUV,是一种颜色编码方法。

YUV是编译true-color颜色空间(color space)的种类,Y'UV, YUV, YCbCrYPbPr等专有名词都可以称为YUV,彼此有重叠。“Y”表示明亮度(Luminance、Luma),“U”和“V”则是色度浓度(Chrominance、Chroma),Y'UV, YUV, YCbCr, YPbPr 常常有些混用的情况,其中 YUV 和 Y'UV 通常用来描述类比讯号,而相反的 YCbCr 与 YPbPr 则是用来描述数位的影像讯号,例如在一些压缩格式内 MPEG、JPEG 中,但在现今,YUV 通常已经在电脑系统上广泛使用。YUV Formats分成两个格式:

  • 紧缩格式(packed formats):将Y、U、V值储存成Macro Pixels阵列,和RGB的存放方式类似。
  • 平面格式(planar formats):将Y、U、V的三个份量分别存放在不同的矩阵中。

紧缩格式(packed format)中的YUV是混合在一起的,对于YUV4:4:4格式而言,用紧缩格式很合适的,因此就有了UYVY、YUYV等。平面格式(planar formats)是指每Y份量,U份量和V份量都是以独立的平面组织的,也就是说所有的U份量必须在Y份量后面,而V份量在所有的U份量后面,此一格式适用于采样(subsample)。平面格式(planar format)有I420(4:2:0)、YV12、IYUV等。

历史

图像中的 Y', U,和 V 组成

Y'UV 的发明是由于彩色电视黑白电视的过渡时期[1]。黑白视讯只有 Y(Luma,Luminance)视讯,也就是灰阶值。到了彩色电视规格的制定,是以 YUV/YIQ 的格式来处理彩色电视图像,把 UV 视作表示彩度的 C(Chrominance或Chroma),如果忽略 C 讯号,那么剩下的 Y(Luma)讯号就跟之前的黑白电视讯号相同,这样一来便解决彩色电视机与黑白电视机的相容问题。Y'UV 最大的优点在于只需占用极少的带宽。

彩色图像记录的格式,常见的有 RGB、YUV、CMYK等。彩色电视最早的构想是使用RGB三原色来同时传输。这种设计方式是原来黑白带宽的3倍,在当时并不是很好的设计。RGB 诉求于人眼对色彩的感应,YUV则着重于视觉对于亮度的敏感程度,Y 代表的是亮度,UV 代表的是彩度(因此黑白电影可省略UV,相近于RGB),分别用Cr和Cb来表示,因此YUV的记录通常以 Y:UV 的格式呈现。

常用的YUV格式

为节省带宽起见,大多数 YUV 格式平均使用的每像素位数都少于24位元。主要的采样(subsample)格式有YCbCr 4:2:0、YCbCr 4:2:2、YCbCr 4:1:1和 YCbCr 4:4:4。YUV的表示法称为 A:B:C 表示法:

  • 4:4:4 表示完全取样。
  • 4:2:2 表示 2:1 的水平取样,没有垂直下采样。
  • 4:2:0 表示 2:1 的水平取样,2:1 的垂直下采样。
  • 4:1:1 表示 4:1 的水平取样,没有垂直下采样。

最常用Y:UV记录的比重通常 1:1 或 2:1,DVD-Video 是以 YUV 4:2:0 的方式记录,也就是我们俗称的I420,YUV4:2:0并不是说只有U(即 Cb), V(即 Cr)一定为 0,而是指U:V互相援引,时见时隐,也就是说对于每一个行,只有一个U或者V份量,如果一行是4:2:0的话,下一行就是4:0:2,再下一行是4:2:0...以此类推。至于其他常见的YUV格式有YUY2、YUYV、YVYU、UYVY、AYUV、Y41P、Y411、Y211、IF09、IYUV、YV12、YVU9、YUV411、YUV420等。

YUY2

YUY2(和YUYV)格式为像素保留 Y,而 UV 在水平空间上相隔二个像素采样一次。YVYUUYVY格式跟YUY2类似,只是排列顺序有所不同。Y211格式是Y每2个像素采样一次,而UV每4个像素采样一次。AYUV格式则有一 Alpha通道。

YV12

YV12格式与IYUV类似,每个像素都提取Y,在UV提取时,将图像2 x 2的矩阵,每个元素中提取一个U和一个V。YV12格式和I420格式的不同处在V平面和U平面的位置不同。在I420格式中,U平面紧跟在Y平面之后,然后才是V平面(即:YUV);但YV12则是相反(即:YVU)。NV12与YV12类似,效果一样,YV12中 U 和 V 是连续排列的,而在NV12中,U 和 V 就交错排列的。

转换

YUV 与 RGB 的转换公式:


\begin{array}{rll}
Y &= 0.299 * R + 0.587 * G + 0.114 * B \\
U &= 0.436 * (B - Y) / (1 - 0.114) \\
V &= 0.615 * (R - Y) / (1 - 0.299)
\end{array}

U 和 V 元件可以被表示成原始的 R、 G,和 B:


\begin{array}{rll}
Y &= 0.299 * R + 0.587 * G + 0.114 * B \\
U &= -0.14713 * R - 0.28886 * G + 0.436 * B \\
V &= 0.615 * R - 0.51499 * G - 0.10001 * B
\end{array}

如一般顺序,转移元件的范围可得到:


\begin{array}{rll}
Y & \in \left[0, 1\right] \\
U & \in \left[-0.436, 0.436\right] \\
V & \in \left[-0.615, 0.615\right]
\end{array}

在逆转关系上,从 YUV 到 RGB,可得


\begin{array}{rll}
R & = Y + 1.13983 * V \\
G & = Y - 0.39465 * U - 0.58060 * V \\
B & = Y + 2.03211 * U
\end{array}

取而代之,以矩阵表示法(matrix representation),可得到公式:


\begin{bmatrix} Y \\ U \\ V \end{bmatrix}
=
\begin{bmatrix} 0.299 & 0.587 & 0.114 \\ -0.14713 & -0.28886 & 0.436 \\ 0.615 & -0.51498 & -0.10001 \end{bmatrix}
\begin{bmatrix} R \\ G \\ B \end{bmatrix}


\begin{bmatrix} R \\ G \\ B \end{bmatrix}
=
\begin{bmatrix} 1 & 0 & 1.13983 \\ 1 & -0.39465 & -0.58060 \\ 1 & 2.03211 & 0 \end{bmatrix}
\begin{bmatrix} Y \\ U \\ V \end{bmatrix}

YUV 转 RGB

function RGB* YUV444toRGB888(Y, U, V);将 YUV format 移转成简单的 RGB format 并可以用浮点运算实作:

Y'UV444

大多数 YUV 格式平均使用的每像素位数都少于24位元。YUV444是最逼真的格式,一格不删(24 bits),即每4个Y,配上4个 U,还有4个 V;YUV422则是在UV格式上减半,即每4个Y,配2个U,2个V ;YUV420则是在UV上减至1/4之格式,即每4个Y,配1个U,再配1个V。

这些公式是基于 NTSC standard;

Y' =  0.299 \times R + 0.587 \times G + 0.114 \times B
U  = -0.147 \times R - 0.289 \times G + 0.436 \times B
V  =  0.615 \times R - 0.515 \times G - 0.100 \times B

在早期的非SIMD(non-SIMD)构造中,floating point arithmetic 会比 fixed-point arithmetic 稍慢,所以有一替代公式如下:

C = Y' − 16
D = U − 128
E = V − 128

使用前面的系数并且用 clip() 注明切割的值域是 0 至 255,如下的公式是从 Y'UV 到 RGB (NTSC version):

R = clip(( 298 \times C                + 409 \times E + 128) >> 8)
G = clip(( 298 \times C - 100 \times D - 208 \times E + 128) >> 8)
B = clip(( 298 \times C + 516 \times D                + 128) >> 8)

注意:上述的公式多暗示为 YCbCr. 虽然称为 YUV,但应该严格区分 YUV 和 YCbCr 这两个专有名词有时并非完全相同。

ITU-R 版本的公式差异:

Y  = 0.299 \times R + 0.587 \times G + 0.114 \times B + 0
Cb = -0.169 \times R - 0.331 \times G + 0.499 \times B + 128
Cr = 0.499 \times R - 0.418 \times G - 0.0813 \times B + 128
R = clip(Y + 1.402 \times (Cr - 128))
G = clip(Y - 0.344 \times (Cb - 128) - 0.714 \times (Cr - 128))
B = clip(Y + 1.772 \times (Cb - 128))

ITU-R 标准 YCbCr(每一通道8位元)至 RGB888:

Cr = Cr - 128; Cb = Cb - 128;

R = Y + Cr + Cr > > 2 + Cr > > 3 + Cr > > 5
G = Y − (Cb > > 2 + Cb > > 4 + Cb > > 5) − (Cr > > 1 + Cr > > 3 + Cr > > 4 + Cr > > 5)
B = Y + Cb + Cb > > 1 + Cb > > 2 + Cb > > 6

Y'UV422

Input:读取 Y'UV 的4bytes(u, y1, v, y2 )
Output:写入 RGB的6bytes (R, G, B, R, G, B)
u  = yuv[0];
y1 = yuv[1];
v  = yuv[2];
y2 = yuv[3];

以此一资讯可以剖析出 regular Y'UV444 格式而成为 2 RGB pixels info:

rgb1 = Y'UV444toRGB888(y1, u, v);
rgb2 = Y'UV444toRGB888(y2, u, v);

Y'UV422 可被表达成 Y'UY'2 FourCC 格式码。意思是 2 pixels 将被定义成 each macropixel (four bytes) treated in the image. Yuv422 yuy2.svg

Y'UV411

// Extract YUV components
u  = yuv[0];
y1 = yuv[1];
y2 = yuv[2];
v  = yuv[3];
y3 = yuv[4];
y4 = yuv[5];
rgb1 = Y'UV444toRGB888(y1, u, v);
rgb2 = Y'UV444toRGB888(y2, u, v);
rgb3 = Y'UV444toRGB888(y3, u, v);
rgb4 = Y'UV444toRGB888(y4, u, v);

所以结果会得到 4 RGB 像素的值 (4*3 bytes) from 6 bytes. This means reducing size of transferred data to half and with quite good loss of quality.

YV12

The Y'V12 的格式相当类似 Y'UV420p,但 U 与 V 资料反转:Y' 跟随着 V, U 殿后。Y'UV420p 与 Y'V12 使用相同算法。许多重要的编码器都采用YV12空间存储视频:MPEG-4(x264XviDDivX),DVD-Video存储格式MPEG-2,MPEG-1以及MJPEG。

将Y'UV420p 转换成 RGB

Height = 16;
Width  = 16;
Y'ArraySize = Height × Width;    // (256)
Y' = Array[7 × Width + 5];
U = Array[(7/2) × (Width/2) + 5/2 + Y'ArraySize];
V = Array[(7/2) × (Width/2) + 5/2 + Y'ArraySize + Y'ArraySize/4];

RGB = Y'UV444toRGB888(Y', U, V);

Copyright © 2024 无忧consume
Powered by .NET 9.0 on Kubernetes