首页 理论教育 提高地理信息系统空间数据质量

提高地理信息系统空间数据质量

时间:2023-08-24 理论教育 版权反馈
【摘要】:空间数据质量控制是指在GIS建设和应用过程中,对可能引入误差的步骤和过程加以控制,对这些步骤和过程的一些指标和参数予以规定,对检查出的错误和误差进行修正,以达到提高系统数据质量和应用水平的目的。数据类型转换和数据格式转换是GIS数据处理中的常用操作,这些操作都是通过一定的运算而实现的,因而也都会带来一定的误差。叠加分析是GIS特有的,也是极为重要的应用分析功能之一。

提高地理信息系统空间数据质量

空间数据质量控制是指在GIS建设和应用过程中,对可能引入误差的步骤和过程加以控制,对这些步骤和过程的一些指标和参数予以规定,对检查出的错误和误差进行修正,以达到提高系统数据质量和应用水平的目的。在进行空间数据质量控制时,必须明确数据质量是一个相对的概念,除了可度量的空间和属性误差外,许多质量指标是难以确定的。因此空间数据质量控制主要是针对其中可度量和可控制的质量指标而言的。数据质量控制是个复杂的过程,要从数据质量产生和扩散的所有过程和环节入手,分别采取一定的方法和措施来减少误差。

(一)空间数据质量控制的方法

1.传统的手工方法

质量控制的手工方法主要是将数字化数据与数据源进行比较,图形部分的检查包括目视方法、绘制到透明图上与原图叠加比较,属性部分的检查采用与原属性逐个对比或其他比较方法。

2.元数据方法

数据集的元数据中包含了大量的有关数据质量的信息,通过它可以检查数据质量,同时元数据也记录了数据处理过程中质量的变化,通过跟踪元数据可以了解数据质量的状况和变化。

3.地理相关法

用空间数据的地理特征要素自身的相关性来分析数据的质量。例如,从地表自然特征的空间分布着手分析,山区河流应位于微地形的最低点,因此,叠加河流和等高线两层数据时,若河流的位置不在等高线的汇水线上且不垂直相交,则说明两层数据中必有一层数据有质量问题,如不能确定哪层数据有问题时,可以通过将它们分别与其他质量可靠的数据层叠加来进一步分析。因此,可以建立一个有关地理特征要素相关关系的知识库,以备各空间数据层之间地理特征要素的相关分析之用。

(二)空间数据生产过程中的质量控制

数据质量控制应体现在数据生产和处理的各个环节。下面仍以地图数字化生成空间数据过程为例,介绍数据质量控制的措施。

1.数据源的选择

选择内容和质量满足系统建设要求的数据源是选择数据源的基本要求。这一阶段的数据质量控制,主要主意以下方面:

(1)首先,数据源的误差范围不能大于系统对数据误差的允许范围。因为数据处理过程中的每一步都会保留原有误差,并可能引入新的误差。那样,进入数据库或经过分析后输出的数据误差就会超出系统对误差的容许范围。

(2)地图数据源,最好采用最新的二底图,即采用以变形较小的薄膜片为材料制作的分版图,以降低输入原图的复杂性和可能的变形误差。(www.xing528.com)

(3)尽可能减少数据处理的中间环节。如直接使用测量数据建库而不是将测量数据先行制图,再在所制地图基础上经数字化而建立空间数据库

2.数字化过程的数据质量控制

主要从数据预处理、数字化设备的选用、对点精度、数字化限差和数据精度检查等环节出发。

(1)数据预处理。主要包括对原始地图、表格等的整理、清绘。对于质量不高的数据源,如散乱的文档和图面不清晰的地图,通过预处理工作不但可减少数字化误差,还可提高数字化工作的效率。对于扫描数字化的原始图形或图像,还可采用分版扫描的方法,来减小矢量化误差。

(2)数字化设备的选用。主要按手扶数字化仪、扫描仪等设备的分辨率和精度等有关参数进行挑选,这些参数应不低于设计的数据精度要求。一般要求数字化仪的分辨率达到0.025mm,精度达到0.2mm;对扫描仪的分辨率则不低于300DPI(Dots Per Inch)。

(3)数字化对点精度(准确性)。数字化对点精度是指数字化时数据采集点与原始点重合的程度。一般要求数字化对点误差小于0.1mm。

(4)数字化限差。数字化时各种最大限差规定为:曲线采点密度2mm、图幅接边误差0.2mm、线划接合距离0.2mm、线划悬挂距离0.7mm。对于接边误差的控制,通常当相邻图幅对应要素间距离小于0.3mm时,可移动其中一个要素以使两者接合;当这一距离在0.3mm与0.6mm之间时,两要素各自移动一半距离;若距离大于0.6mm,则按一般制图原则接边,并作记录。

(5)数据的精度检查。主要检查输出图与原始图之间的点位误差。一般对直线地物和独立地物,这一误差应小于0.2mm;对曲线地物和水系,这一误差应小于0.3mm;对边界模糊的要素应小于0.5mm。

(三)空间数据处理分析中的质量控制

地理数据在计算机的处理分析过程中,会因为计算过程本身引入误差,主要包括:

(1)计算误差。计算机能否按所需的精度存储和处理数据,主要取决于数据存储的有效位数。数据位数较小时,反复的运算处理过程会使舍入误差积累,带来较大误差。

(2)数据转换误差。数据类型转换和数据格式转换是GIS数据处理中的常用操作,这些操作都是通过一定的运算而实现的,因而也都会带来一定的误差。特别是矢量数据格式与栅格数据格式之间的转换,会因为栅格单元尺寸而大受影响。

(3)拓扑叠加分析误差。叠加分析是GIS特有的,也是极为重要的应用分析功能之一。无论矢量数据还是栅格数据,都将叠加分析作为其重要的空间分析手段。矢量数据的多边形叠加分析,由于多边形的边界不可能完全重合,从而产生若干无意义的多边形,对这样无意义多边形的处理往往会改变多边形的边界位置而引起误差,并可能由此进一步带来空间位置上的地物属性误差。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈