图像压缩中DCT变换的优势及原理

优势

DCT变换可以将高频信号与低频信号分开,从而在压缩时将下三角区域的高频信号进行更充分的压缩(其实就是进行更离散的量化)

原理
人对亮度信息更为敏感

首先将RGB格式转化为YCbCr格式,做DCT变换(这是为了便于分别对亮度和色度分量进行处理)
因为人的视觉系统对亮度信息更为敏感,左图中看似A比B颜色更深,但在右图中把它们连起来就好发现,其实AB的颜色一样深。其原因是人眼对亮度边界的变化更敏感,B的边界颜色比B深,对比之下我们会认为B比A颜色浅。
image
因此压缩时,可以对色度分量进行下采样,每个2$\times$2的色块采样为同一种颜色,这样Cb和Cr分量可以压缩3/4.

人对高频信号并不敏感

把图像的每一行当成波信号,波动多的为高频信号,波动少的为低频信号:
image
那么如何将图像中的高频信号和低频信号分离出来呢?
将该信号波视为多个不同频率余弦函数的叠加。(那选取了哪八个余弦函数呢,它们和原始信号的关系是什么呢?)、
八个dct系数分别表示:均值,cos(x1),cos(x2),...cos(x7)的系数
而且,由于我们只考虑八个离散的点,因此任何一个八个像素的信号都可以由八种余弦波来叠加表示。(可逆变换)
image

原始信号和DCT的变换公式如下图所示:
image
用向量来表示可以看做:
image
对于整张图像,则进行二维DCT变换
image
然后通过量化表对高频和低频分量进行不同程度的压缩(不同的压缩质量参数对应着不同的量化表)
image

posted @ 2024-05-15 11:39  浪矢-CL  阅读(164)  评论(0编辑  收藏  举报