图像表示与图像处理的基本概念

目录

  1. 图像及其数字化表示
  2. 数字图像处理
  3. 图像质量的评价

一、图像及其数字化表示

1.1 人类对光本性认识

  • 光微粒子:牛顿 -> 几何光学 -> 直线传播 --能解释的现象:反射、折射、透射
  • 光波:惠更斯等 -> 波动光学 -> 波长、频率 --能解释的现象:干涉、衍射
  • 光(量)子:爱因斯坦、普朗克 -> 量子光学 -> 能量量子化(不连续) --能解释的现象:光电效应、康普顿散射

1.2 图像的颜色

常用的颜色模型

  • RGB(红、绿、蓝)-> 主动产生颜色光源(显示器)
  • CMYK(青、品红、黄、黑) (Cyan, Magenta, Yellow, Black) -> 用于印刷、绘画等
  • HSI(色调、色饱和度、亮度) (Hue, Saturation, Intensity) ->用于调整颜色分量

1.2.1 RGB 三基色

人眼的感受光谱范围约为380~780 nm,原则上可采用各种不同的三色组为标准化,1931年国际照明委员会(CIE)作了统一规定,选定波长700nm、546.1nm和435.8nm的单色光作为红、绿、蓝三原色,又称为物理三基色。任意彩色的颜色方程为:

利用RGB可产生大量的颜色,例如:RGB灰度级分别为256时,可产生224 ≈ 16.8 M 种颜色

颜色空间:描述颜色的三维空间坐标, 一个颜色定义为颜色空间的一个点

RGB颜色模型是三维直角坐标颜色系统中的一个单位正方体,在正方体的主对角线上,各原色的量相等,产生由暗到亮的白色,即灰度。(0,0,0)为黑,(1,1,1)为白,正方体的其他6个角点分别为红、黄、绿、青、蓝和品红

1.2.2 颜色模型—CMY模型

CMY为相减混色,它与相加混色的RGB空间正好互补,也即用白色减去RGB空间中的某一色彩值就等于同样色彩在CMY空间中的值

由于彩色墨水和颜料的化学特性,用等量的CMY三基色得到的黑色不是真正的黑色,因此在印刷术中常加一种真正的黑色,所以CMY又写成CMYK

1.2.3 颜色模型—HSI 模型

从人的视觉系统出发,用色调(Hue)、色饱和度( Saturation或Chroma)和亮度(Intensity 或Brightness)来描述色彩

它比RGB色彩空间更符合人的视觉特性

  • H、S、I 可以分开处理而且相互独立
  • 在HSI色彩空间可以大大简化图像分析和处理的工作量
  • HSI色彩空间和RGB色彩空间只是同一物理量的不同表示法,因而它们之间存在着转换关系
  • 在图像处理和计算机视觉中大量算法都可在HSI色彩空间中方便地使用

I:表示光照强度或称为亮度,它确定了像素的整体亮度,而不管其颜色是什么。其最亮值为1,0为最暗。

H:表示色调,由角度表示(0~360º)。反映了该颜色最接近什么样的光谱波长。0º为红色,120º为绿色,240º为蓝色。

S:表示色饱和度,色饱和度参数是色环的原点到彩色点的半径长度。在环的外围圆周是纯的或称饱和的颜色,其饱和度值为1。在中心是中性(灰)影调,即饱和度为0

1.2.4 颜色模型转换

1.3 图像表示

  • 物理图像—可用连续函数进行较好地描述、分析与处理
  • 数字图像—时空与幅度均为离散的数据矩阵

图像的采样与量化

  • "分辨率:在一定的面积内取多少个点,或者多少个像素;
  • "数据深度":记录每个点的某一因素(亮度/色度)的数据位数。

采样点数越多,图像质量越好。当采样点数减少时,图上的块状效应就逐渐明显。当图像的采样点数一定时,量化级数越多,图像质量越好。量化级数最小的极端情况就是二值图像,图像出现假轮廓。

不同量化级别对图像质量的影响。显然,无论从平面的取点还是记录数据的深度来讲,采样形成的图像与母本必然有一定的差距,丢掉了一些数据。但这个差距如果控制得相当的小,那么这个差距就是可以接受的。

传统图像的描述方式与数据结构

矩阵(matrices)---黑白、灰度、彩色、…… /链表(chains)/拓扑结构(Topological data structures)/ 关系结构(Relational structures) ……

矩阵—黑白图像(二值图像): 指图像的每个像素只能是黑或者白,没有中间的过渡,故又称为二值图像。2值图像的像素值为01

矩阵—灰度图像:灰度图像像素的灰度级通常为8Bits,即0~255。"0"表示 纯黑色,"255"表示纯白色。现实图像的类型基本上可表示为灰度图像,其像素灰度级常用的为8 Bits,但向着10 Bits、12 Bits、16 Bits发展。

矩阵—灰度图像:

矩阵—彩色图像: 通常彩色图像是指每个像素的信息由RGB三原色构成的图像,其中RGB是由不同的灰度级来描述的。

图片格式:https://www.jianshu.com/p/f6bde0058c94

1.4 颜色模型的应用-利用HSI模型特性消除红眼

"红眼"—闪光灯照相的结果:在HSI空间可定义红眼为: -π/4 < 色调<π/4 色饱和度 > 0.3

处理算法

  • 在脸部的特定区域进行色空间转换RGB -> HSI
  • 测试每一点像素
  • 如果:-π/4 < H <π/4 and S>0.3
  • 则该像素为红眼像素,使其成为灰色:S=0

二、数字图像处理

对数字图像处理的定义:

对一个物体的数字表示—二维矩阵—施加一系列的操作,以得到所期望的结果。,常借助于连续函数的分析结果与处理方法进行离散处理,"数字图像处理"不是指"处理数字图像",而是指"图像的数字处理"

数字图像处理方式:

  • 将一幅图像变为另一幅经过加工的图像,图像 到图像的过程
  • 将一幅图像转化为一种非图像的表示,分析、识别与理解的过程

数字图像处理研究的内容

图像变换:改变图像的空间或频谱分布,获取或突出感兴趣信息

  • 空域变换:放大、缩小、旋转……
  • 频域变换:傅立叶变换、离散余弦变换、Walsh变换 小波变换……

图像增强和复原

  • 提高图像质量(去除噪声、提高图像的清晰度)
  • 灰度修正、图像平滑、几何校正、图像锐化……

图像的理解和识别

  • 从图像中提取抽象化的特定信息
  • 统计模式分类、句法模式分类……

连续与离散

  • 模拟图像:空间位置的连续性;每个位置上的光强度变化连续性
  • 数字图像:采样(Sample):空间离散化,采样(Sample):空间离散化

图像采样需解决的首要问题:从采样点精确恢复原图像所需要的最小的采样点个数,即各采样点在水平和垂直方向的最大间隔。该问题可看作一维采样定理在二维上的推广。

一维Nyquist采样定理:如果一维信号x(t) 是频带受限信号,其最高频率为fc,当采样频率满足 fs ≥2fc 时,则原信号可由离散样点值精确重建。

二维Nyguist采样定理: 原始图像在水平方向的频率为um,在垂直方向的频率为vm,只要水平方向的空间采样频率u0≥2um,垂直方向的空间采样频率v0≥2vm,即采样点的水平间隔Δx≤(1/2um) ,垂直间隔Δy≤(1/2vm) ,则图像可被精确地恢复。

可见当量化层数 K 加大,则每层长度 L 缩小,总的均方误差也成平方比例缩小,更有利于保持原图的灰度信息。

代数运算

对于两幅输入图像进行点对点的加、减、乘、除计算而得到输出图像。代数运算的一般表达式如下:

(1)加法应用: 对同一场景的多幅图像求平均值,达到降低加性随机噪声的影响;将一幅图像的内容叠加到另一幅图像上,达到二次曝光的效果。

(2)减法应用:对同一景物在不同时间的图像或同一景物在不同波段的图像相减(减影技术)。

应用:利用图像间的差异信息,指导动态监测、运动目标检测和跟踪;图像背景消除及目标识别的工作。减影技术在医学上应用广泛。

减法应用:混合图像分离

(3)乘法应用:可用来遮掉图像的某些部分( 掩膜图像)

在掩膜图像中要保留部分的值为1,要被抑制掉的区域则值为零。使用掩膜图像去乘一幅图像,可抹去图像的某部分,即使该不部分为零。

(4)除法应用:除法操作给出的是相应像素值的变化比率,而不是每个像素值的绝对差值,图像相除又称比值处理,是遥感图像处理中常用的方法。

数字图像处理的特点

1、图像信息量大、数据量也大;

在数字图像处理中,一幅图像可看成是由图像矩阵中的像素(pixel)组成的,每个像素的灰度级至少要 6bit(单色图像)来表示,一般采用8bit(彩色图像),高精度的可用12bit 或 16bit。

2、图像处理技术综合性强;

在数字图像处理中涉及的基础知识和专业技术相当广泛。一般来说涉及通信技术、计算机技术、电子技术、电视技术及数学、物理等方面的基础知识。

3、图像信息理论与通信理论密切相关。

早在1948年Shannon发表了"A mathematical Theory of Communication"(通信中的数学理论)一文,它奠定了信息论的基础。此后,信息理论已渗透到了各个领域。图像信息论也属于信息论科学中的一个分支。

图像信息论是在通信理论研究的基础上发展起来的。通信研究的是一维时间信息;图像研究的是二维空间信息。也就是说,图像理论是把通信中的一维问题推广到二维空间上来研究的。

三、图像质量的评价

图像质量评价研究已成为图像信息工程的基础技术之一,当前对图像质量的评估方法主要分成两类

主观评价—通过人眼主观视觉效果进行判断,方法与标准已相对完善

客观评价—通过客观的测量给出量化指标

客观评价-传统客观评价方法

通过计算恢复图像偏离原始图像的误差来衡量恢复图像的质量,最常用的有均方误差(MSE)和峰值信噪比(PSNR)

其中N、M分别是x方向、y方向图像像素点的个数,fij和f'ij分别是原始图像和测试图像在(i, j)点上的取值,L是图像中灰度取值的范围,对8比特的灰度图像而言,L=255。

客观评价-基于视觉感知的测量方法

从视觉心理学角度,视觉是一种积极的感受行为,不仅与生理因素有关,还在相当大的程度上取决于心理因素;人们在观察和理解图像时往往会不自觉地对其中某些区域产生兴趣,这些区域称之为"感兴趣区(ROI)",整幅图像的视觉质量往往取决于ROI的质量;人们探索各种ROI评价方式。如通过对图像中不同区域的加权突出人眼对ROI的兴趣程度

   

   

   

posted @ 2020-03-29 14:39  忆凡人生  阅读(2186)  评论(0编辑  收藏  举报