YUV颜色编码

公告

Posted on 2011-12-13 14:35 无忧consume 阅读(1076) 评论(0) 编辑收藏举报

YUV，是一种颜色编码方法。

YUV是编译true-color颜色空间（color space）的种类，Y'UV, YUV, YCbCr，YPbPr等专有名词都可以称为YUV，彼此有重叠。“Y”表示明亮度（Luminance、Luma），“U”和“V”则是色度、浓度（Chrominance、Chroma），Y'UV, YUV, YCbCr, YPbPr 常常有些混用的情况，其中 YUV 和 Y'UV 通常用来描述类比讯号，而相反的 YCbCr 与 YPbPr 则是用来描述数位的影像讯号，例如在一些压缩格式内 MPEG、JPEG 中，但在现今，YUV 通常已经在电脑系统上广泛使用。YUV Formats分成两个格式：

紧缩格式（packed formats）：将Y、U、V值储存成Macro Pixels阵列，和RGB的存放方式类似。
平面格式（planar formats）：将Y、U、V的三个份量分别存放在不同的矩阵中。

紧缩格式（packed format）中的YUV是混合在一起的，对于YUV4:4:4格式而言，用紧缩格式很合适的，因此就有了UYVY、YUYV等。平面格式（planar formats）是指每Y份量，U份量和V份量都是以独立的平面组织的，也就是说所有的U份量必须在Y份量后面，而V份量在所有的U份量后面，此一格式适用于采样（subsample）。平面格式（planar format）有I420（4:2:0）、YV12、IYUV等。

历史

图像中的 Y', U，和 V 组成

Y'UV 的发明是由于彩色电视与黑白电视的过渡时期^[1]。黑白视讯只有 Y（Luma，Luminance）视讯，也就是灰阶值。到了彩色电视规格的制定，是以 YUV/YIQ 的格式来处理彩色电视图像，把 UV 视作表示彩度的 C（Chrominance或Chroma），如果忽略 C 讯号，那么剩下的 Y（Luma）讯号就跟之前的黑白电视讯号相同，这样一来便解决彩色电视机与黑白电视机的相容问题。Y'UV 最大的优点在于只需占用极少的带宽。

彩色图像记录的格式，常见的有 RGB、YUV、CMYK等。彩色电视最早的构想是使用RGB三原色来同时传输。这种设计方式是原来黑白带宽的3倍，在当时并不是很好的设计。RGB 诉求于人眼对色彩的感应，YUV则着重于视觉对于亮度的敏感程度，Y 代表的是亮度，UV 代表的是彩度（因此黑白电影可省略UV，相近于RGB），分别用Cr和Cb来表示，因此YUV的记录通常以 Y:UV 的格式呈现。

常用的YUV格式

为节省带宽起见，大多数 YUV 格式平均使用的每像素位数都少于24位元。主要的采样（subsample）格式有YCbCr 4:2:0、YCbCr 4:2:2、YCbCr 4:1:1和 YCbCr 4:4:4。YUV的表示法称为 A:B:C 表示法：

4:4:4 表示完全取样。
4:2:2 表示 2:1 的水平取样，没有垂直下采样。
4:2:0 表示 2:1 的水平取样，2:1 的垂直下采样。
4:1:1 表示 4:1 的水平取样，没有垂直下采样。

最常用Y:UV记录的比重通常 1:1 或 2:1，DVD-Video 是以 YUV 4:2:0 的方式记录，也就是我们俗称的I420，YUV4:2:0并不是说只有U（即 Cb）, V（即 Cr）一定为 0，而是指U：V互相援引，时见时隐，也就是说对于每一个行，只有一个U或者V份量，如果一行是4:2:0的话，下一行就是4:0:2，再下一行是4:2:0...以此类推。至于其他常见的YUV格式有YUY2、YUYV、YVYU、UYVY、AYUV、Y41P、Y411、Y211、IF09、IYUV、YV12、YVU9、YUV411、YUV420等。

YUY2

YUY2（和YUYV）格式为像素保留 Y，而 UV 在水平空间上相隔二个像素采样一次。YVYU, UYVY格式跟YUY2类似，只是排列顺序有所不同。Y211格式是Y每2个像素采样一次，而UV每4个像素采样一次。AYUV格式则有一 Alpha通道。

YV12

YV12格式与IYUV类似，每个像素都提取Y，在UV提取时，将图像2 x 2的矩阵，每个元素中提取一个U和一个V。YV12格式和I420格式的不同处在V平面和U平面的位置不同。在I420格式中，U平面紧跟在Y平面之后，然后才是V平面（即：YUV）；但YV12则是相反（即：YVU）。NV12与YV12类似，效果一样，YV12中 U 和 V 是连续排列的，而在NV12中，U 和 V 就交错排列的。

转换

YUV 与 RGB 的转换公式：

$\begin{array}{rll} Y &= 0.299 * R + 0.587 * G + 0.114 * B \\ U &= 0.436 * (B - Y) / (1 - 0.114) \\ V &= 0.615 * (R - Y) / (1 - 0.299) \end{array}$

U 和 V 元件可以被表示成原始的 R、 G，和 B:

$\begin{array}{rll} Y &= 0.299 * R + 0.587 * G + 0.114 * B \\ U &= -0.14713 * R - 0.28886 * G + 0.436 * B \\ V &= 0.615 * R - 0.51499 * G - 0.10001 * B \end{array}$

如一般顺序，转移元件的范围可得到：

$\begin{array}{rll} Y & \in \left[0, 1\right] \\ U & \in \left[-0.436, 0.436\right] \\ V & \in \left[-0.615, 0.615\right] \end{array}$

在逆转关系上，从 YUV 到 RGB，可得

$\begin{array}{rll} R & = Y + 1.13983 * V \\ G & = Y - 0.39465 * U - 0.58060 * V \\ B & = Y + 2.03211 * U \end{array}$

取而代之，以矩阵表示法（matrix representation），可得到公式：

$\begin{bmatrix} Y \\ U \\ V \end{bmatrix} = \begin{bmatrix} 0.299 & 0.587 & 0.114 \\ -0.14713 & -0.28886 & 0.436 \\ 0.615 & -0.51498 & -0.10001 \end{bmatrix} \begin{bmatrix} R \\ G \\ B \end{bmatrix}$

$\begin{bmatrix} R \\ G \\ B \end{bmatrix} = \begin{bmatrix} 1 & 0 & 1.13983 \\ 1 & -0.39465 & -0.58060 \\ 1 & 2.03211 & 0 \end{bmatrix} \begin{bmatrix} Y \\ U \\ V \end{bmatrix}$

YUV 转 RGB

function RGB* YUV444toRGB888(Y, U, V)；将 YUV format 移转成简单的 RGB format 并可以用浮点运算实作：

Y'UV444

大多数 YUV 格式平均使用的每像素位数都少于24位元。YUV444是最逼真的格式，一格不删（24 bits），即每4个Y，配上4个 U，还有4个 V；YUV422则是在UV格式上减半，即每4个Y，配2个U，2个V ；YUV420则是在UV上减至1/4之格式，即每4个Y，配1个U，再配1个V。

这些公式是基于 NTSC standard;

$Y' = 0.299 \times R + 0.587 \times G + 0.114 \times B$

$U = -0.147 \times R - 0.289 \times G + 0.436 \times B$

$V = 0.615 \times R - 0.515 \times G - 0.100 \times B$

在早期的非SIMD（non-SIMD）构造中，floating point arithmetic 会比 fixed-point arithmetic 稍慢，所以有一替代公式如下：

C = Y' - 16

D = U - 128

E = V - 128

使用前面的系数并且用 clip() 注明切割的值域是 0 至 255，如下的公式是从 Y'UV 到 RGB (NTSC version):

$R = clip(( 298 \times C + 409 \times E + 128) >> 8)$

$G = clip(( 298 \times C - 100 \times D - 208 \times E + 128) >> 8)$

$B = clip(( 298 \times C + 516 \times D + 128) >> 8)$

注意：上述的公式多暗示为 YCbCr. 虽然称为 YUV，但应该严格区分 YUV 和 YCbCr 这两个专有名词有时并非完全相同。

ITU-R 版本的公式差异：

$Y = 0.299 \times R + 0.587 \times G + 0.114 \times B + 0$

$Cb = -0.169 \times R - 0.331 \times G + 0.499 \times B + 128$

$Cr = 0.499 \times R - 0.418 \times G - 0.0813 \times B + 128$

$R = clip(Y + 1.402 \times (Cr - 128))$

$G = clip(Y - 0.344 \times (Cb - 128) - 0.714 \times (Cr - 128))$

$B = clip(Y + 1.772 \times (Cb - 128))$

ITU-R 标准 YCbCr（每一通道8位元）至 RGB888:

Cr = Cr - 128; Cb = Cb - 128;

R = Y + C r + C r > > 2 + C r > > 3 + C r > > 5

G = Y - (C b > > 2 + C b > > 4 + C b > > 5) - (C r > > 1 + C r > > 3 + C r > > 4 + C r > > 5)

B = Y + C b + C b > > 1 + C b > > 2 + C b > > 6

Y'UV422

Input：读取 Y'UV 的4bytes(u, y1, v, y2 )

Output：写入 RGB的6bytes (R, G, B, R, G, B)

u  = yuv[0];
y1 = yuv[1];
v  = yuv[2];
y2 = yuv[3];

以此一资讯可以剖析出 regular Y'UV444 格式而成为 2 RGB pixels info:

rgb1 = Y'UV444toRGB888(y1, u, v);
rgb2 = Y'UV444toRGB888(y2, u, v);

Y'UV422 可被表达成 Y'UY'2 FourCC 格式码。意思是 2 pixels 将被定义成 each macropixel (four bytes) treated in the image.

Y'UV411

// Extract YUV components
u  = yuv[0];
y1 = yuv[1];
y2 = yuv[2];
v  = yuv[3];
y3 = yuv[4];
y4 = yuv[5];

rgb1 = Y'UV444toRGB888(y1, u, v);
rgb2 = Y'UV444toRGB888(y2, u, v);
rgb3 = Y'UV444toRGB888(y3, u, v);
rgb4 = Y'UV444toRGB888(y4, u, v);

所以结果会得到 4 RGB 像素的值 (4*3 bytes) from 6 bytes. This means reducing size of transferred data to half and with quite good loss of quality.

YV12

The Y'V12 的格式相当类似 Y'UV420p，但 U 与 V 资料反转：Y' 跟随着 V, U 殿后。Y'UV420p 与 Y'V12 使用相同算法。许多重要的编码器都采用YV12空间存储视频：MPEG-4（x264，XviD，DivX），DVD-Video存储格式MPEG-2，MPEG-1以及MJPEG。

将Y'UV420p 转换成 RGB

Height = 16;
Width  = 16;
Y'ArraySize = Height × Width;    // (256)
Y' = Array[7 × Width + 5];
U = Array[(7/2) × (Width/2) + 5/2 + Y'ArraySize];
V = Array[(7/2) × (Width/2) + 5/2 + Y'ArraySize + Y'ArraySize/4];

RGB = Y'UV444toRGB888(Y', U, V);

刷新页面返回顶部