ArcGIS矢量数据模型(shapefile、coverage和geodatabase)
基本概念
矢量数据模型,也称离散数据模型,是采用离散对象(点、线和多边形)来表示地球表面的空间要素的。
- Coverage和Shapfile是地理关系数据模型的例子,它使用分离系统储存地理空间数据的两个主要成分——几何图形和属性。Coverage是有拓扑关系的(即空间要素之间有明确的空间关系),Shapfile是非拓扑的。
- Geodatabase是基于对象数据模型的例子,它将矢量数据的几何图形和属性数据储存在单一系统中,并可以根据需求建立拓扑关系。
拓扑
- 拓扑是研究几何对象在弯曲或拉伸等变换下仍保持不变的性质。
- 拓扑需要增加数据文件来储存空间关系。
- 拓扑能确保数据质量和完整性。
- 拓扑能强化GIS分析;空间要素之间的拓扑关系使得GIS用户可执行空间数据查询。
地理关系数据模型
地理关系数据模型是用两个独立的系统分别储存空间和属性数据:用图形文件储存空间数据,即“地理”;用关系数据库储存属性数据,即“关系”。地理关系数据模型一般用要素标识码(ID)对两者进行链接。Coverage和Shapefile是地理关系数据模型的例子。
Coverage支持以下三种基本拓扑关系:
- 连接性:弧段间通过节点彼此连接;
- 面定义:由一系列相连的弧段定义面;
- 邻接性:弧段有方向性,且有左多边形和右多边形。
多边形/弧段清单作为图形文件储存在Coverage文件夹中。另一个文件夹叫做INFO,与全部的Coverage在相同的工作空间中共享,用于储存属性数据文件。基于拓扑关系的数据结构有利于数据文件的组织,并减少数据的冗余。
非拓扑矢量数据Shapefile中,点是用x,y坐标,线是用一系列的点,多边形用一系列的线来储存,但没有描述几何对象空间关系的文件。Shapfile的几何学性质储存于两个基本文件中:以shp为扩展名的文件存储要素几何学特征;以shx为扩展名的文件储存要素几何学特征的空间索引。
基于对象数据模型
基于对象数据模型将地理空间数据作为对象,一个对象可以表示空间要素,也可以表示一个图层或基于图层的坐标系统。与地理关系数据模型不同在于:
- 基于对象数据模型把空间数据和属性数据储存在单一系统中。具有数据类型BLOB(binary large object)的空间数据以特定字段储存为一个二进制数据的集合。
- 基于对象数据模型允许一个空间要素(对象)与一系列属性和方法相联系:属性描述对象的性质或特征;方法执行特定的操作。
类和类之间的关系:类是一系列具有相似属性的对象,面向对象技术允许建立类之间的关系。用于一个几何要素类中的要素规则,在功能上与Coverage模型所带的拓扑规则很相似,而用于两个或多个要素类的规则只出现在Geodatabase。
Geodatabase用点、聚合线和多边形来表示基于矢量的空间要素。
Geodatabase将矢量数据组织成要素类和要素数据集。要素类存储具有相同几何数据类型的空间要素;要素数据集则储存具有相同坐标系和区域范围的要素类。如果一个要素类属于Geodatabase,但又不是要素集的一部分,被成为独立要素类。Geodatabase还能储存栅格数据、不规则三角网(TIN)、位置数据和属性表。
- Personal Geodatabase将数据储存在Access数据库的表格中。
- File Geodatabase把数据以许多小文件的形式储存在二进制文件夹中。
复合要素的表示
一些空间要素表示为点、线和面的复合更利于其应用。
- 不规则三角网(TIN):把地表近似描绘成一组互不重叠的三角面。每个三角面在TIN中都有一个恒定的倾斜度。TIN数据结构包括三角形编号、每个毗邻的三角形的编号和数据文件,数据文件列表显示点、边界,以及每个高程点的x,y,z值。在Geodatabase中,可以将高程点和线、面要素类一起储存于要素数据集中,使用要素数据集和它的内容可以即时构建一个TIN。
- 分区:指具有相似特征的地域范围。分区可以在空间上相连或分离;分区可以重叠或涵盖相同区域。分区在多边形Coverage中以亚类来组织,并通过附加数据文件,每个分区与其上的多边形和弧段建立联系。Shapefile和Geodatabase的数据结构支持多部分。多部分可以空间连接或不连接,并可以相互重叠。
- 路径:指公路、河流等线要素,与其他线要素不同在于它有度量系统,可以使线性测量用于投影坐标系统中。路径在线性Coverage中储存为亚类,通过区段和弧段工作。Shapefile和Geodatabase使用具有m值(测量值)的聚合线来储存,这些测量基于预定的起点。