图像处理之绪论

一、引言

数字图像处理方法的重要性源于两个主要应用领域:

  • 改善图示信息以便人们解释
  • 为存储、传输和表示而对图像数据进行处理,以便于机器自动理解

1.1 什么是数字图像处理

 一幅图像可定义为一个二维函数f(x, y),其中x和y是空间(平面)坐标,而在任
何一对空间坐标(x, y)处的幅值f称为图像在该点处的强度或灰度。
 当x, y和灰度值f是有限的离散数值时,我们称该图像为数字图像。
 数字图像处理是指借助于计算机来处理数字图像。
 数字图像是由有限数量的元素组成的,每个元素都有一个特定的位置和幅值。
 这些元素称为图像元素或像素。像素是广泛用于表示数字图像元素的术语。
 人类的感知仅限于电磁波谱的视觉波段。
 成像机器几乎可以覆盖从伽马射线到无线电波的整个电磁波谱。它们可以对非人类所习惯的那些图像源进行加工。
 数字图像处理涉及很宽泛的各种各样的应用领域。

1.2 数字图像处理的起源

 数字图像处理最早的应用之一是在报纸业。
 借助电报打印机进行数字图像传输甚至可以追溯到上世纪20年代。
 早在上世纪20年代曾引入电缆图片传输系统,把横跨大西洋传送一幅图片所需的时间从一个多星期减少到3个小时。
 为了用电缆传输图片,首先使用特殊的打印设备对图片编码,然后,在接收端重构这些图片。
 下图就是用这种方法传送并利用装有打印机字体的电报打印机模拟中间色调还原出来的图像。

 这些早期数字图片视觉质量的改进工作,涉及到打印过程的选择和亮度等级的分布等问题。
 用于得到上图的打印方法到1921年底就被彻底淘汰了,转而支持一种基于照相还原的技术,该技术在电报接收端使用穿孔纸带来还原图片。
 下图就是用这种方法得到的图像,对比上图,它在色调质量和分辨率方面的改进都很明显。

 早期的系统用5个灰度等级对图像编码,到1929年已增加到15个等级。
 在这一时期,由于引入了一种使用编码图片纸带调制光束而使底片感光的系统,明显地改善了还原过程。
 在上世纪60年代,第3代计算机的研制成功,以及快速傅里叶变换算法的发现和应用使得对图像的某些计算得以实现。
 人们从而逐步开始利用计算机对图像进行加工利用。

1.3 使用数字图像处理领域的实例

1.3.1 遥感技术

 以前,需要大量的人力对侦察飞机拍摄的空中摄影照片进行分析。 现在利用图像处理系统进行判读分析,既可以提高效率,又可以从照片中提取人工所不能发现的大量的有用情报。
 遥感技术分为飞机遥感和卫星遥感技术。从遥感卫星所获得的图像的图像质量有
时不是很好,如果仍采用简单的直观判读如此昂贵代价所获取的的图像是不合算的,因此必须采用图像处理技术。

立体航拍图像上叠加的地形等高线图:

移动样本或视角得到的用于测量两幅不同图像中物体间垂直高度差的几何(通常用于航拍)d1-d2为同一地面点在两幅图像中的视差

南极洲臭氧层空洞的卫星照片

Dobson(多布森)单位是用于臭氧含量测绘中测量臭氧含量的标准单位,正常值大约是300 Dobson单位。

NASA的LANDSAT卫星的主要波段:

 多光谱遥感图像需要进行融合配准,以期获得单独每个谱段所不能获得的更为
丰富的信息,这就必须采用数字图像处理技术。

加拿大舍布鲁克大学的全色波段高分辨率(1m)卫星遥感图像:

加拿大舍布鲁克大学的多谱段低分辨率(4m)卫星遥感图像:

Intensity–hue–saturation (IHS)图像融合算法:

Brovey transform (BT)图像融合算法:

Principal component analysis (PCA) 图像融合算法:

High-pass filtering (HPF)图像融合算法:

原始的LRMI图像以及通过IHS, BT, PCA, HPF, HPM, ATW和MRAIM方法融合后的HRMI图像:

1.3.2 医学图像处理

 医学上不管是基础科学还是临床应用,都是图像处理应用种类极多的领域。生物医学的显微图像的处理分析,例如红白细胞、细菌和染色体的分析。
 大家最熟悉的X射线在医学成像中的应用是计算机轴向断层术(CT)。通过CT,可以产生人体的大量“切片”,这些剖面图合在一起就构成了病人体内的三维图,使得肌体病变特别是肿瘤诊断起到了革命性的变化。
 CT断层摄影术是由Godfrey N. Hounsfield和Allan M. Cormack分别发明的。由于这项发明,他们共同获得了1979年的诺贝尔医学奖。X射线是1895年由Wilhelm Conrad Roentgen(威廉·康拉德·伦琴)发现的,由于这一发现,他获得了1901年的诺贝尔物理学奖。

头部CT:

每幅CT图像都是垂直穿 过 病 人 的 一 个 “ 切片”,当病人纵向移动时 可 产 生 大 量 的 “ 切片”,这些图像组合在一起就构成了人体内部的三维描绘图像。其纵向分辨率与切片数量成正比。

通过人体头部的多个切片组成的三维空间:

基于CT扫描数据的肺部支气管血管解剖结构的三维可视化:

超声波成像的实例:

基于活动轮廓模型(Snake)的心内膜超声图像分割:

 在医学中,无线电波可以用于核磁共振成像(MRI),是继CT后医学影像学的又一重大进步。相对于X-射线透视技术和放射造影技术,MRI对人体没有辐射影响,相对于超声探测技术,核磁共振成像更加清晰,能够显示更多细节。

MRI图像:

将头部MRI图像三维数字化后用于面相识别:

1.3.3 工业领域中的应用

 基于机器视觉技术的物体二维或三维坐标精密测量、深度方向的距离测量和空
间定位。机器人视觉是机器人应用中一个非常关键的核心技术。
 工业产品的无损探伤、表面和外观的自动检查和识别、装配和生产线的自动化、印刷电路板的视觉检查、机械零件的自动识别分类和几何尺寸测量等。

三维在线视觉检测系统组成:

汽车白车身激光视觉检测站:

ATOS三维光学扫描仪:

 德国GOM公司生产的ATOS流动式光学扫描仪是目前市场上最为先进的非接触式三坐标扫描设备。

 该设备采用可见光,将特定的光栅条纹投影到测量工件表面,借助两个高分辨
率工业CCD摄像机对光栅干涉条纹进行拍照。利用光学拍照定位技术、立体视觉技术和光栅测量原理,可在极短的时间获得复杂工件表面的完整点云。其独特的流动式设计和不同视角点云的自动拼合技术,使扫描不需要借助于机床的驱动,扫描范围可达10m,而扫描大型工件则变得高效、轻松和容易。

 ATOS三维光学扫描仪主要由扫描头、三脚架、计算机、控制器等组成。其中扫描头由两个高分辨率工业CCD摄像机、镜头、光栅投射器组成。

ATOS系统测量原理示意图:

 ATOS系统采用结构光测量方式,利用光栅投影单元将一组具有相位信息的光栅条纹投影到测量工件表面。利用左右两个高分辨率工业CCD相机进行同步拍照,利用立体视觉测量原理,可以在极短的时间内获得物体表面大量的三维数据。

1.3.4 航空航天方面

 “嫦娥一号”卫星月球三维地形的获取。常规的航空航天对地摄影只获取正视
(星下点)二维图像,而要获得立体图像,通常需要用三台线阵相机。
 CE-1上的中科院西安光机所CCD立体相机采用了一个广角物镜和1024×1024面阵CCD的独特设计,实现了上述功能。

利用三线阵方式拍摄月面图像的原理示意图:

北京密云和云南昆明数据接收地面站接收CE-1卫星下传数据示意图:

 相机工作时,CCD立体相机采用线阵推扫的方式获取月面同一目标的前视、正视和后视三条线阵的影像。
 即利用1024行中的第1行、第512行和第1023行分别对月面同一目标进行三次扫描拍摄。
 第1行数据为前视17°获取的图像,第512行数据为正视图像,第1023行为后视17°获取的图像。
 形象地说就是,当相机与拍摄目标连线与垂直方向成前视17°时,CCD立体相机探测器的第1行获取目标的前视图像。
 经过大约42秒(卫星运行了约66km)后,当相机与拍摄目标连线与月面垂直时,CCD立体相机探测器的第512行获取该目标的正视图像。
 再经过大约42秒后,当相机与拍摄目标连线与垂直方向成后视17°时,探测器的第1023行获取该目标的后视图像。
 这样,月面同一目标就在84秒的时间内被CCD立体相机拍摄了三幅照片,即地面目标的前视、正视和后视图像。

CCD立体相机成像过程示意图:

等高线和三维景观图:

地形等高线平面图:

地形等高线立体图:

月面三维地形模拟:

 摄像机拍摄的角度和幅度都是有限的,通过拍摄多张照片,然后通过图像拼接算法,可以把多张图片拼接成一张全景图片。

1.3.5 军事公安方面

 运动目标的图像自动跟踪技术,例如巡航导弹的三维自动地形识别与匹配。
 公安业务图片的判读分析,如指纹识别、不完整图片的复原等。
 公安中的跟踪、窃视、交通监控、事故分析。

指纹识别:

 中科院自动化所完成的项目“基于大形变和低质量的指纹加密方法与应用”荣获2012年度国家技术发明二等奖。

 “基于大形变和低质量的指纹加密方法与应用”研究了基于生物特征的加密技术,重点解决了对大形变、低质量指纹鲁棒且适合于生物特征加密的指纹特征提取方法;并以这些指纹特征为基础,结合模式识别与密码技术,发明了安全实用的指纹加密方法,并在新型指纹特征提取、密钥生成算法等方面提出了系列创新方法。该项目的发明有效地提高了生物特征识别系统的安全性和隐私性,真正做到物理身份和数字身份的统一。

虹膜识别:

 虹膜是位于人眼表面黑色瞳孔和白色巩膜之间的圆环状区域,在红外光下呈现出丰富的纹理信息,如斑点、条纹、细丝、冠状、隐窝等细节特征。
 虹膜识别技术通过对比虹膜图像特征之间的相似性来确定人们的身份。
 虹膜识别的精确度是各种生物认证技术中最高的。具有非接触式采集、生物特征稳定等优点。

虹膜识别的优势:

虹膜身份识别系统基本流程:

人脸探测:

车脸识别:

 车脸识别又叫车辆重识别,也称为车辆检索,旨在找到不同监控场景下的同一辆车。数据显示,65%以上的犯罪案件都与车辆有关。
 而在涉车案件中,嫌疑车辆的车牌通常是假牌、套牌,无法通过识别车牌号码来锁定车辆身份,因此基于视觉表观的“车辆重识别技术”具有重大研究意义和实用价值。
 不同于车型分类,车脸识别更精细,更具挑战性。它不仅要判断两辆车是否属于同一个精细车型,还需要确定两辆同一年款相同颜色的车是不是同一辆车。

基于结构化特征度量学习的车脸识别方法:

1.3.6 文化艺术方面

 图像、视频的压缩编码和解码。
 电视画面的数字编辑。
 绘画等艺术作品的三维重建。
 文物资料照片和旧电影拷贝的修复。

基于图像的三维重建:

1.4图像处理、分析和理解的层次

解决图像理解问题的途径和步骤

1.5 数字图像处理的基本步骤

数字图像处理的相关领域:

1、图像获取
 图像获取是第一步处理。
 通常,图像获取阶段包括图像预处理。

2、图像增强
 图像增强是对一幅图像进行某种操作,使其结果在特定应用中比原始图像更适合进行处理。
 空间域图像增强。
 频率域图像增强。

3、图像复原
 图像复原也是改进图像外观的一个处理领域。
 与图像增强不同,图像增强是主观的,而图像复原是客观的。
 在某种意义上说,复原技术倾向于以图像退化的数学或概率模型为基础。

4、形态学处理
 形态学处理涉及提取图像分量的工具,这些分量在表示和描述形状方面很有用。
 从输出图像处理到输出图像属性处理的转换开始。

5、图像分割
 分割过程将一幅图像划分为它的组成部分或目标。
 通常,自动分割是数字图像处理中最困难的任务之一。
 成功地把目标逐一识别出来是一个艰难的分割过程。通常,分割越准确,识别越成功

6、表示与描述
 表示与描述几乎总是在分割阶段的输出之后。
 选择一种表示仅是解决把原始数据转换为适合计算机进行后续处理的形式的一部分。
 为了描述数据以使感兴趣的特征更明显,必须确定一种方法。描述又称为特征选择,涉及提取特征,它可得到某些感兴趣的定量信息,或是区分一组目标与其他目标的基础。

7、目标识别
 识别是基于目标的描述给该目标赋予标志(譬如“车辆”)的过程。

1.6 图像处理系统的组成

通用图像处理系统的组成:

光电成像系统的基本构成:

面阵图像传感器的成像过程:

1.7 图像处理和计算机视觉的主要国际会议

二、参考文献

 教育部高等教育司推荐:国外电子与通信教材系列。
 《数字图像处理(第三版)》,冈萨雷斯等著,阮秋琦等译,电子工业出版社, 2011年6月。
 北京航空航天大学《数字图像处理》课程

posted on 2022-03-02 23:55  lixin05  阅读(264)  评论(0编辑  收藏  举报