空间统计笔记之二(分布模式工具集,Analyzing Patterns Toolset)
Average Nearest Neighbor
- 工具简介
平均最近邻工具用来度量在不考虑属性的前提下,要素在空间上的分布趋势是离散分布、聚集分布还是随机分布。该工具会计算每一个要素的质心到最近的邻居的距离之和 的平均值,再与假设随机分布的距离做比较。如果比值小于1,则认为是聚集分布;如果大于1,则认为是离散分布。
- 主要参数
Input Feature Class:输入的矢量要素类,一般是点类型;对于线类型或面类型的要素,则取他们的质心进行计算;
Distance Method:欧几里得距离:计算平面上两点之间的直线距离;曼哈顿距离:计算两点之间两个直角边的距离之和;解释见另一篇博文http://www.cnblogs.com/gisangela/archive/2012/10/22/2734176.html
Area:该工具对面积是敏感的,不同的地理尺度会造成不同的分析结果。默认是输入要素类的外包矩形,可以指定实际的面积大小。
- 输出结果解析
该工具会给出一系列的统计值,包括计算得到的邻居之间的平均距离(Observed Mean Distance)、期望的随机分布的平均距离(Expected Mean Distance)、这两者之 间的比值(Nearest Neighbor Ratio)以及Z分数和P值。同时也可以输出为HTML报表,直观地以图形形式输出分析的结果。
High/Low Clustering(Getis-Ord General G)
- 工具简介
该工具返回某个属性在空间上是高值聚类还是低值聚类的可能性,零假设是随机分布。如果P值具有统计显著性,则可推翻零假设。可以用该工具来反映GDP产值大部分是高于平均水平(高值聚集)还是低于平均水平(低值聚集)。
- 主要参数
Conceptualization of Spatial Relationships:度量要素间空间位置关系的方式,推荐使用Fixed Distance Band, Polygon Contiguity方法;
Standardization:行标准化一般是在数据存在可能的偏见性的时候采用,一般是由于有偏采样造成的,这里推荐使用None;
Weights Matrix File(optional):空间权重矩阵文件,可指定ASCII码格式的权重文件,如果要素的个数大于5000个,建议转换成swm格式。
- 输出结果解析
该工具会给出一系列的统计值,包括Observed General G, Expected General G, 方差(Variance), Z分数和P值。如果P值具有显著性,则看Z值为正则Observed General G大于Expected General G,说明为高值聚类;如果Z值为负,则Observed General G小于Expected General G,为低至聚类。
Multi-Distance Spatial Cluater Analysis(Ripleys K Function)
- 工具简介
该工具在多尺度自相关分析中经常使用,可以对给出的一系列距离内要素的离散或是聚集程度进行度量。边缘校正是该工具一个很重要的参数。在生态学中常用该工具来做种群的空间格局分析。
- 主要参数介绍
Number of distance bands:设置多少个距离区间;
Compute Confidence Envelope:确定随机分布上下包迹线的方法,Monte Carlo方法是选取m组n个随机数,求出每组的l(d)值,分别取最大和最小值最为上下包迹线的取值,一般建议使用99组随机模拟值来确定包迹线的区间。可理解为不同的置信水平(90%,99%,99.9%);
Weight field:要素的权重字段,例如一个点要素的权重为3,则意味着在同一坐标位置有三个重复的点;
Beginning distance:起始距离;
Distance Increment:距离步长;
Boundary Correction Method(边缘校正):用来对位于研究范围边界处的要素邻居个数进行估计的方法
NONE——不进行校正,即便输入的要素落入了研究范围外,仍会作为邻居参与位于边界处的要素的计算;
SIMULATE_OUTER_BOUNDARY_VALUES——对位于边界范围内的要素(一个距离步长内)会按照研究范围的边界产生镜像要素,作为其邻居参与到计算中;
REDUCE_ANALYSIS_AREA——该方法会按照距离步长对研究范围进行收缩,位于收缩范围内的要素就作为邻居参与计算;
RIPLEY'S_EDGE_CORRECTION_FORMULA——该方法会比较每个要素与研究范围边界的距离与邻居的距离,如果邻居距离大于到边界的距离会赋予额外的权重,刚方法适合研究范围是矩形的情况。
Study Area Method:该工具算法对面积是敏感的,默认为MINIMUM_ENCLOSING_RECTANGLE(即要素的最小外包矩形);USER_PROVIDED_STUDY_AREA_FEATURE_CLASS(指定一个多边形要素类来获取面积)
- 输出结果
该工具会给出图形输出和表格输出两种结果。图形输出中包括ObservedK, ExpectedK,Lower Confidence Envelop,Higher Confidence Envelop曲线,表格中还包括了DiffK(即ObservedK和ExpectedK的差值)。如果在某个距离内ObservedK大于ExpectedK,则为聚类分布;反之为离散分布特征。如果ObservedK大于Higher Confidence Envelop的值,意味着聚集分布具有统计显著性;如果ObservedK小于Low Confidence Envelop的值,意味着这时的离散分布具有统计显著性。
Spatial Autocrrelation(Morans I)
- 工具简介
该工具是全局Moran I算法的实现,可以反映要素的空间位置以及属性值的空间聚集或离散的趋势。
- 主要参数介绍
Conceptualization of Spatial Relationships:度量要素间空间位置关系的方式:
INVERSE DISTANCE——距离越近的要素具有越大的权重,越远权重越小;
INVERSE DISTANCE SQUARED——同上,权重的衰减更快;
FIXED DISTANCE BAND——指定距离内的要素权重为1,超出该距离的权重为0;
ZONE OF INDIFFERENCE——指定距离内的要素权重为1,超出该距离的权重随距离而衰减;
POLYGON CONTIGUITY——对多边形而言,与目标要素邻接的要素才作为邻居参与到计算中;
GET SPATIAL FORM FILE——可指定权重文件;
Standardization:行标准化一般是在数据存在可能的偏见性的时候采用,一般是由于有偏采样造成的;
- 输出结果解析
该工具会给出Moran's I Index, Expected Index, Variance以及Z分数和P值,如果P值具有统计显著性,则可推翻零假设(随机分布),Z值为正则为聚类分布,Z值为负则为离散分布。如果选择了ROW Standardization,Moran I的值一般在-1到1之间。