从定性遥感到定量遥感——大数据时代的空间数据科学(转)
原文地址:http://blog.sciencenet.cn/blog-3247241-1073425.html
定性遥感
类似于看图识物,通过将遥感影像当做特殊的“图片”,通过诸如计算机的图像识别、分类的方法去进行分析和处理得到我们所需要的Knowledge。比如简单的土地利用分类、面向对象的分割与分类或者监测变化等,仅仅是定性的划分。
定量遥感
李传荣老师的定义:向社会和公众提供有用信息的技术。要精准描述构成地物状态特征的物理化学要素,以及导致地物目标变化的物理化学动力驱动机制。
遥感目前的根本在于电磁波。要做的不仅仅是将电磁波谱映射成普通图像去做解译、分类。既然我们通过卫星接收到了很多人类无法肉眼观测到的电磁波信息,那么我们就希望通过建立具有物理意义的方程以及模型,将电磁波信息转化为对人类更有用的Knowledge。这就是定量遥感所要做的事情,核心就是如何通过卫星接收的数据和具有实际物理意义的模型去反演得到我们所需要的产品。
反演
我想知道B的具体值,但是我无法直接观测B的具体值,但是我能观测到A的具体值,而A和B相互之间的关系,可以通过物理学意义的模型或者是其他模型进行表达,那么我就同过A的值去反推出B的值,这就是反演。相信大家就会很清楚,在定量遥感里,A就是传感器接受的波谱信息,而B则可以有很多种东西。
反演类型
1.二氧化碳探测——温室气体
2.地表温度反演——MODIS的LST产品
3.气溶胶反演——MODIS气溶胶产品
4.生态环境定量遥感—— 植被动态变化与生态环境相关要素 如 叶面积指数\NDVI\NPP\GPP
模型
定量遥感从模型来说,主要分为几类:经验模型、半经验模型、物理模型。
1)经验模型可以被认为是统计意义上的模型,即无视具体的物理过程,单纯靠统计方法建立的模型。
2)半经验模型一般是结合了部分的物理意义的统计模型。
3)物理模型则是严格按照电磁波谱和辐射传输特性经过推导的到的机理模型。
可以说物理模型才是定量遥感真正的核心,因为前面两个模型建立之后通常无法复制。
物理模型其实有两大部分,(1、辐射传输方程推导的模型2、几何光学模型(普及下,这就是布鞋院士李小文院士从事的研究))
发展
从定性遥感走向定量遥感是必然,但由于地表的复杂性、定量遥感反演目前出现的病态反演问题、定量遥感产品缺乏验证和质量控制的多重因素影响,定量遥感的研究依旧处在一个不为人知的和无法广泛应用的时代。
复杂性——地表非朗伯体特性、地形起伏等影响;
病态反演问题——参数求解过程大部分是求解参数大于方程数;
缺乏验证和质量控制——不确定性,缺乏统一标准等。
很多人都会这么说,遥感数据是GIS里面的天生大数据,确实遥感数据满足了大数据的4V或者说5V的特征,但是它又跟计算机意义上的大数据有所不同。计算机上的大数据普遍的格式是什么呢?比较典型包括像文本、图片、视频,而甚至像LBS这样的经纬度数据。简而言之,它是高频数据,时间间隔非常短(诸如5min这样的时间间隔)。而遥感数据却不同,卫星的重访周期基本上很难达到5min,所以它非高频数据,那么从这个角度来说,很多大数据算法是否适用呢?同时它具有非常丰富的物理信息,所以就像老师们说的,我们更应该考虑的是这个不太一般的大数据如何去用,不是简单的拿来主义,用这些所谓的机器学习、深度学习去看图识物,可能更值得考虑的事如何将定量遥感的物理模型与大数据的数据挖掘、机器学习等手段相结合。
对于空间数据科学来说,这可能是个最好的时代。因为我们不缺数据,但是可能也是个最坏的时代,因为我们多的是黑箱的算法,更缺少的是内在机制的理论研究。
毕竟,科学家还是要有梦去追。