高光谱图像选择波段的研究

转自:http://blog.csdn.net/chenyanqiao2010/article/details/52312483

 

本文是根据 魏芳洁 所著的 “高光谱图像波段选择方法的研究”一文而写,基本细节皆引自此文。

高光谱主要问题是波段数多,数据量大,给高光谱图像的分类、识别带来了很大困难。信息冗余度高,数据存储所需空间大,处理时间长,由于高光谱图像波段数多,容易出现维数灾难现象,即分类精度下降,因此,减少数据量、节省资源的降维处理非常有必要,特征提取和波段选择是高光谱图像的两种主要降维方法。利用特征提取进行降维,算法复杂,计算量较大,而且是通过某种变换来实现降维目的,改变了原始数据的物理意义而不利于数据翻译,相比之下,波段选择是从高光谱图像所有波段中选择起主要作用的波段子集,不仅能大大降低高光谱图像的数据维度,而且能比较完整的保留有用的信息,更有特殊意义。

高光谱图像的波段选择是一种很复杂的波段组合优化问题,它要求所选的波段组合有较好的性能,即选择出信息量较大、相关性较小、类别可分性较好的波段组合。波段选择技术包括两方面:一方面是准则函数,另一方面是搜索方法。现有的波段选择方法大多不能兼顾时间效率和精解效率两个方面,研究一种兼顾时间效率和精解效率的波段选择方法是急需解决的问题。

1、结合遗传算法和蚁群算法的高光谱图像波段选择

2、结合拟态物理学优化算法的高光谱图像波段选择。采用了类间可分性和波段组合的信息量两个主要性能指标的权重组合作为适应度函数,此外,在算法开始时先对高光谱图像进行了子空间划分,使得最优解中的波段间相关性较小,冗余度低。

3、快速 SGA 算法的构建及在波段选择中的应用。

高光谱图像

高光谱遥感(Hyperspectral Remote Sensing)是用多而窄的电磁波波段来获取感兴趣物体的相关信息[2]。成像光谱学是二十世纪八十年代开始建立,它是在电磁波的紫外、可见光、近红外和中红外区域获得很多很窄且光谱连续的图像的技术。高光谱遥感图像是将反映目标辐射的光谱信息与反映目标二维空间的图像信息集于一体,实现了“图谱合一”,即在二维空间信息的基础上添加了一维光谱信息,其光谱分辨率在纳米数量级范围内,波段宽度一般在 10nm 以下。高光谱图像数据是二维空间和一维光谱的图像立方体,在图像空间中每个波段是一幅二维图像;在光谱空间中每个像素则反映为一条连续光谱响应曲线,不同的物质在高光谱图像中表现为不同的辐射强度,它具有波段数多、波段宽度窄的特点,所以能对同一目标地物连续成像,可以反映出目标地物的诊断性光谱特征,而多光谱遥感不具有这一特征,这也是高光谱遥感与多光谱遥感的主要区别。


目前,高光谱图像波段选择方法很多,一般都是依据一定的评价准则函数进行波段组合搜索从而达到降维的目的,其包括两方面技术:一方面是评价准则函数,即用来衡量选择的波段组合是否最优;另一方面是搜索方法,即采用高效率的波段组合搜索方法。

常用的评价准则函数:

①信息量度量,即以特征的增益来衡量,典型的度量有:信息熵、协方差矩阵特征值、最佳指数索引等;

②距离度量,即以类别间的可分性来度量,典型的度量有:均值间的标准距离、离散度、Bhattacharyya距离(也称B距离)、Jeffreys-Matusita距离(也称JM距离);

③相关性度量,即以特征间的相关性来衡量,典型的度量有:光谱角度制图法(SAM) 、光谱信息散度(SID)和正交投影散度(OPD)等。

高光谱图像波段选择的发展可以看做是搜索最优波段子集问题的发展,即依据一定的搜索方法在高光谱图像所有波段中寻找使准则函数最优的波段子集。波段选择方法根据搜索方法可分为最优搜索波段选择法和次优搜索波段选择法。
论文中有关于这两种算法的介绍,有兴趣的可以直接去看原文。

高光谱数据的表达形式
①、图像空间,从人的视觉角度出发,将高光谱数据视为图像,这种表达形式直观、自然,且为地物目标提供了空间分布的形式,即为每个波段图像提供了地物的空间几何关系。图像中各像素与地面景物相关联,像素间的几何关系反映了真实地物间的空间关系,这种关系对高光谱图像模式识别处理是非常重要的。但是因为人的视觉系统只可感知单一波段的灰度图或三波段组成的假彩色图,所以图像空间表达形式不能充分地反映高光谱图像的全部信息。
②、光谱空间,可视为横坐标为不同波段、纵坐标为辐射强度的二维空间。在高光谱图像中,每一像素对应一条近似连续的光谱响应曲线。光谱响应反映了不同的地物在不同的波段对电磁波的反射和吸收特性,不同的地物表现出不同的光谱响应曲线。因此,根据不同的地物光谱响应曲线,人们可以直观地区分地物,或者根据不同地物的物理特性来寻找可分性好的波段。但实际中,由于大气、噪声等多因素的影响,容易产生异物同谱或同物异谱以及混合光谱现象,使得仅利用光谱响应曲线不能很好地识别地物,需要借助特征空间的表达形式。

③、特征空间,高光谱图像提供了一个高维特征空间,高维特征空间是空的,图像数据分布不均匀,且趋于集中在高维立方体空间的角端。特征空间可视为光谱响应曲线的另一种表示,其将光谱特征与图像所包含的地物模式对应起来,因此,很难想象不同地物模式在高维特征空间是如何分布。但从数学角度出发,其非常适于模式识别。由于特征空间提供了最多的信息,所以更适合高光谱图像的研究。

 

相对于多光谱图像而言,高光谱图像具有光谱分辨率较高、谱间相关性较强以及特征空间分布奇异的特点。

①、光谱分辨率

在相同的波长范围内,高光谱几乎是连续的,而多光谱图像的光谱响应曲线是不连续的,分辨率相对较低,从而易产生异物同谱的现象。

②、谱间相关性

谱间相关性是指同一空间位置在不同波段图像的相似性,产生原因有,同一地物在不同波段光反射率是非常相近的,而且同一像素的不同波段图像对应于同一地物目标,它们有相同的空间拓扑结构。

③、高光谱图像特征空间数据分布的奇异性

波段选择的思想

最优波段子集的选择是从高光谱图像的所有波段 D 中通过某种搜索方法选出数量为 d(d<D)的波段子集,使得评价准则函数达到最大。

对高光谱图像而言,由于维数的急剧增加,使得用于参数估计所需的训练样本个数急剧增加,如果训练样本的个数较小,不满足特征空间的维数增加要求,则影响估计出的参数精度,进而无法得到令人满意的分类结果。

数据的冗余度--虽然高光谱图像给我们提供了大量更精细的地物信息,但在某些具体实际应用中,数据量的增加并没有增加原有的信息量。高光谱图像的冗余包括空间冗余和光谱冗余。在一个波段图像中,由于同一地物表面采样点的灰度之间通常表现为空间连贯性,而基于离散像素采样所表示的地物灰度并没有充分利用这种特征,所以产生了空间冗余。由于高光谱图像高的光谱分辨率和高的数据维数,使得图像中的某一波段的信息可以部分或完全由图像中其他波段预测,所以产生了光谱冗余。

数据量大,计算量大。

波段选择的原则

(1)从信息论的角度考虑,选择信息量最大的波段或者波段子集。常用准则有信息熵、方差和最佳指数等。

(2)从分类角度考虑,选择使地物类别间可分性最好的波段或者波段子集。衡量准则有离散度、Bhattacharyya 距     离、Jeffreys-Matusita 距离等。

(3)从数理统计的角度考虑,选择波段之间相关性最弱的波段子集,以保证波段间的独立性和有效性。衡量相关性   准则有光谱相关系数(SCM)。相关系数越大表示光谱波段间的相关性越强。

(4)从光谱学角度考虑,选择使待研究区域内预识别地物目标的光谱特征差异性最大的波段子集。衡量光谱特征差   异性的准则有光谱角度制图法(SAM)、正交投影散度(OPD)、光谱信息散度(SID)等。光谱角度制图法(SAM):即           夹角余弦法,是通过计算一个测试像元光谱与一个参考像元光谱(实验室光谱或图像上提取的像元光谱)之间的光           谱“角度”来确定二者之间的相似度;正交投影散度(OPD):其思想源于正交子空间投影(OPS),目的是最大限度地           分离目标和背景信息;光谱信息散度:表征各类地物目标间的光谱信息量的差异,是通过KL距离来计算两地物光谱         间的相对熵(信息量的差异)

posted @ 2017-06-14 15:53  琴断影花  阅读(5055)  评论(0编辑  收藏  举报