空间统计笔记之二（分布模式工具集，Analyzing Patterns Toolset）

Average Nearest Neighbor

工具简介

平均最近邻工具用来度量在不考虑属性的前提下，要素在空间上的分布趋势是离散分布、聚集分布还是随机分布。该工具会计算每一个要素的质心到最近的邻居的距离之和的平均值，再与假设随机分布的距离做比较。如果比值小于1，则认为是聚集分布；如果大于1，则认为是离散分布。

主要参数

Input Feature Class:输入的矢量要素类，一般是点类型；对于线类型或面类型的要素，则取他们的质心进行计算；

Distance Method：欧几里得距离：计算平面上两点之间的直线距离；曼哈顿距离：计算两点之间两个直角边的距离之和；解释见另一篇博文http://www.cnblogs.com/gisangela/archive/2012/10/22/2734176.html

Area：该工具对面积是敏感的，不同的地理尺度会造成不同的分析结果。默认是输入要素类的外包矩形，可以指定实际的面积大小。

输出结果解析

该工具会给出一系列的统计值，包括计算得到的邻居之间的平均距离（Observed Mean Distance）、期望的随机分布的平均距离（Expected Mean Distance）、这两者之间的比值（Nearest Neighbor Ratio）以及Z分数和P值。同时也可以输出为HTML报表，直观地以图形形式输出分析的结果。

High/Low Clustering(Getis-Ord General G)

工具简介

该工具返回某个属性在空间上是高值聚类还是低值聚类的可能性，零假设是随机分布。如果P值具有统计显著性，则可推翻零假设。可以用该工具来反映GDP产值大部分是高于平均水平（高值聚集）还是低于平均水平（低值聚集）。

主要参数

Conceptualization of Spatial Relationships:度量要素间空间位置关系的方式，推荐使用Fixed Distance Band, Polygon Contiguity方法；

Standardization：行标准化一般是在数据存在可能的偏见性的时候采用，一般是由于有偏采样造成的，这里推荐使用None；

Weights Matrix File(optional)：空间权重矩阵文件，可指定ASCII码格式的权重文件，如果要素的个数大于5000个，建议转换成swm格式。

输出结果解析

该工具会给出一系列的统计值，包括Observed General G, Expected General G, 方差（Variance）, Z分数和P值。如果P值具有显著性，则看Z值为正则Observed General G大于Expected General G，说明为高值聚类；如果Z值为负，则Observed General G小于Expected General G，为低至聚类。

Multi-Distance Spatial Cluater Analysis(Ripleys K Function)

工具简介

该工具在多尺度自相关分析中经常使用，可以对给出的一系列距离内要素的离散或是聚集程度进行度量。边缘校正是该工具一个很重要的参数。在生态学中常用该工具来做种群的空间格局分析。

主要参数介绍

Number of distance bands:设置多少个距离区间；

Compute Confidence Envelope：确定随机分布上下包迹线的方法，Monte Carlo方法是选取m组n个随机数，求出每组的l（d）值，分别取最大和最小值最为上下包迹线的取值，一般建议使用99组随机模拟值来确定包迹线的区间。可理解为不同的置信水平（90%，99%，99.9%）；

Weight field：要素的权重字段，例如一个点要素的权重为3，则意味着在同一坐标位置有三个重复的点；

Beginning distance：起始距离；

Distance Increment：距离步长；

Boundary Correction Method（边缘校正）：用来对位于研究范围边界处的要素邻居个数进行估计的方法

NONE——不进行校正，即便输入的要素落入了研究范围外，仍会作为邻居参与位于边界处的要素的计算；

SIMULATE_OUTER_BOUNDARY_VALUES——对位于边界范围内的要素（一个距离步长内）会按照研究范围的边界产生镜像要素，作为其邻居参与到计算中；

REDUCE_ANALYSIS_AREA——该方法会按照距离步长对研究范围进行收缩，位于收缩范围内的要素就作为邻居参与计算；

RIPLEY'S_EDGE_CORRECTION_FORMULA——该方法会比较每个要素与研究范围边界的距离与邻居的距离，如果邻居距离大于到边界的距离会赋予额外的权重，刚方法适合研究范围是矩形的情况。

Study Area Method：该工具算法对面积是敏感的，默认为MINIMUM_ENCLOSING_RECTANGLE（即要素的最小外包矩形）；USER_PROVIDED_STUDY_AREA_FEATURE_CLASS（指定一个多边形要素类来获取面积）

输出结果

该工具会给出图形输出和表格输出两种结果。图形输出中包括ObservedK, ExpectedK，Lower Confidence Envelop，Higher Confidence Envelop曲线，表格中还包括了DiffK（即ObservedK和ExpectedK的差值）。如果在某个距离内ObservedK大于ExpectedK，则为聚类分布；反之为离散分布特征。如果ObservedK大于Higher Confidence Envelop的值，意味着聚集分布具有统计显著性；如果ObservedK小于Low Confidence Envelop的值，意味着这时的离散分布具有统计显著性。

Spatial Autocrrelation(Morans I)

工具简介

该工具是全局Moran I算法的实现，可以反映要素的空间位置以及属性值的空间聚集或离散的趋势。

主要参数介绍

Conceptualization of Spatial Relationships:度量要素间空间位置关系的方式：

INVERSE DISTANCE——距离越近的要素具有越大的权重，越远权重越小；

INVERSE DISTANCE SQUARED——同上，权重的衰减更快；

FIXED DISTANCE BAND——指定距离内的要素权重为1，超出该距离的权重为0；

ZONE OF INDIFFERENCE——指定距离内的要素权重为1，超出该距离的权重随距离而衰减；

POLYGON CONTIGUITY——对多边形而言，与目标要素邻接的要素才作为邻居参与到计算中；

GET SPATIAL FORM FILE——可指定权重文件；

Standardization：行标准化一般是在数据存在可能的偏见性的时候采用，一般是由于有偏采样造成的；

输出结果解析

该工具会给出Moran's I Index, Expected Index, Variance以及Z分数和P值，如果P值具有统计显著性，则可推翻零假设（随机分布），Z值为正则为聚类分布，Z值为负则为离散分布。如果选择了ROW Standardization，Moran I的值一般在-1到1之间。

posted @ 2012-10-23 11:03 gisangela 阅读(7685) 评论(6) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

阅读排行：
· 阿里最新开源QwQ-32B，效果媲美deepseek-r1满血版，部署成本又又又降低了！
· 单线程的Redis速度为什么快？
· 展开说说关于C#中ORM框架的用法！
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决：字节Trae VS Cursor，谁才是开发者新宠？

公告

昵称： gisangela
园龄： 14年5个月
粉丝： 292
关注： 9

+加关注

2012年10月

日

一

二

三

四

五

六

GIS Change Our Life

空间统计笔记之二（分布模式工具集，Analyzing Patterns Toolset）

Average Nearest Neighbor

High/Low Clustering(Getis-Ord General G)

Multi-Distance Spatial Cluater Analysis(Ripleys K Function)

Spatial Autocrrelation(Morans I)

公告

搜索

常用链接

我的标签

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论