首页 理论教育 空间数据挖掘的任务与内容详解

空间数据挖掘的任务与内容详解

时间:2023-05-18 理论教育 版权反馈
【摘要】:空间数据挖掘是交叉学科,发现的知识有多种,与许多学科既紧密相连又相互区别。M.H.Dunham则把数据挖掘的任务与内容分为8个方面,其中预测性挖掘利用从历史资料中得到的结果对数据做出预测,而描述性挖掘则识别出数据中的模式和关系。

空间数据挖掘的任务与内容详解

从土地利用数据库中可以发现哪些知识类型?这是进行土地利用空间数据挖掘时首先要解决的一个问题,知识的类型也决定着空间数据挖掘的任务类型。空间数据挖掘是交叉学科,发现的知识有多种,与许多学科既紧密相连又相互区别。Jiawei Han等(2007)把数据挖掘功能分为6大类:描述、关联分析、分类和预测、聚类分析、孤立点分析及演变分析。M.H.Dunham则把数据挖掘的任务与内容分为8个方面,其中预测性挖掘(分类、回归分析、时间序列分析、预测)利用从历史资料中得到的结果对数据做出预测,而描述性挖掘(聚类、概括、关联规则序贯分析)则识别出数据中的模式和关系。

综上所述,现有研究对空间数据挖掘内容存在两种主要观点:第一种是认为空间数据挖掘的内容主要是以空间规则和知识挖掘为主;第二种则认为空间数据挖掘不但包括空间规则和知识的挖掘,还包括了几何知识、空间分类知识、预测知识还有空间分布与演化。因此,空间数据库中隐藏着大量的“浅层知识”,如某区域有无一般耕地、农村居民点,这些图斑的周长和面积层等,这些知识一般通过SQL语句或GIS的查询功能就能提取出来;除此以外还有更多的“深层知识”,如空间关联规则、空间分类和预测型知识、空间聚类和偏差型知识、空间分布规律等,必须通过一定的运算和挖掘才能发现。事实上,由于空间数据的复杂性和多样性,空间数据挖掘任务也是多方面的,归纳面向土地利用的空间数据挖掘所能发现的知识类型主要如下:

1.空间几何知识(spatial geometric knowledge)

空间几何知识,是指土地利用图斑的数量、大小、形态特征等空间几何特征。可用统计学方法统计图斑的数量和大小,而图斑的形态特征则是要把直观的可视化的图形用计算机定量化的特征值表示出来。土地利用数据库中一般仅存储图形的周长、面积、权属、几何中心位置等几何特征,而空间几何知识需要用一定的算法来计算,根据数据库中已知的特征来归纳出隐藏在背后的几何知识。

2.空间规则型知识

空间规则型知识(spatial rules and knowledge)包括空间关联规则(spatial association rules)、空间特征规则(spatial characteristic rules)、空间区分规则(spatial discriminate rules)、空间同位规则(spatial co-location rules)和空间演变规则(spatial evolution rules)等(李德仁,2006)。

3.空间分类和预测

空间分类和预测(spatial discriminate and forecast)可以认为是基于已有的空间区分规则,将数据库中的数据单元映射到某个给定的类上,通常可使用空间分类规则用以对未知样本进行分类预测。例如“if地形坡度<5°and排水条件较好,then农用地等级高”就是一条描述农用地等级的空间分类规则,这条空间分类规则必须基于地形坡度和排水条件的空间分布规律来推理。(www.xing528.com)

4.空间聚类和空间例外

目前空间数据挖掘领域研究较多的是空间聚类和分类方法和技术(李德仁,王树良,2002),空间聚类(spatial clustering)就是根据特征相似性对空间数据进行划分使得组间的差别尽可能大,组内的差别尽可能小。空间例外(spatial exceptions and outliers)是大部分空间实体的共性特征之外的偏差或独立点,是与空间数据库或空间数据仓库中的数据的一般行为或通用模型不一致的数据对象的特征。

5.空间分布规律

空间分布规律(spatial distributing)是空间对象在地理空间的分布规律,可分成:①垂直向分布规律,如植被沿高程带分布规律、植被沿坡度坡向分布规律等;②水平向分布规律,如不同区域农作物的差异、公用设施的城乡差异等;③垂直向和水平向的联合分布规律。

6.空间演化

空间演化(spatial evolution knowledge)是从同一地区不同时相的空间数据库中发现该地区空间演化的规律,是空间目标依时间的变化的规律,如土地利用数据库中的土地利用方式的演化等。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈