第八章 地理信息系统:空间统计与空间数据挖掘 8. 2 地统计分析 地统计是统计的一类,用于分析和预测与空间或时空现象相关的值。它将数据的空间坐标纳入分析中,以变异函数为主要工具,研究那些分布于空间上既有随机性又有结构性的自然或社会现象的科学(秦昆,GIS 空间分析理论与方法,2004)。最初,地统计工具作为使用方法进行开发,用于描述空间模式和采样位置的插值。现在这些工具和方法均得到了改进,不仅能够提供插值,还可以衡量所插入的值的不确定性。通过对变异函数、克里格估计以及随机模拟方法的深入扩展,地统计已经成为空间统计学的核心内容,学科的主要内容包括区域化变量的变异函数模型、克里格估计、随机模拟三方面(秦昆,GIS 空间分析理论与方法,2004)。相对于物理机制建模,地统计是一种分析空间位置相关地学信息的经验性方法(赵鹏大,2004)。 接下来将介绍地统计研究的工作流程和主要步骤,并结合ArcGIS Geostatistical Analyst工具进行实践演示。地统计是用于分析和预测与空间或时空现象相关联的值得统计数据类。利用 GIS 工具可以构建使用空间坐标的模型。这些模型可以应用于各种情况并通常用于生成未采样位置的预测,也可以用于生成这些预测的不确定性的度量值。 一般情况下,地统计研究的流程为: 第一步仔细检查数据。 第二步构建地统计模型,根据研究目的和数据集要素的不同,建模过程的步骤会有些差异。在这一阶段,对数据集进行严密地探索并收集信息,扩增对所研究对象的先验知识,这将决定模型的复杂程度和内插值的准确性,以及不确定性的度量值的准确性。 第三步将所建模型与数据集结合来生成感兴趣区域内所有未采样位置的内插值。 最后模型的输出应该经过检查,确保内插值和相关的不确定性的度量值是合理的并与预期相匹配。我们继续以上文中提到的某市区垃圾站数据为例,结合GIS 工具具体介绍如何利用地统计建模插值。 8.2.1 探索性空间数据分析 19 世纪60 年代的 Tukey 面向数据分析的主题,提出了探索性数据分析(EDA,exploratory data analysis)的新思路,解决了传统统计分析中数据不能满足正态假设,基于均值、方差的模型在实际数据分析中缺乏稳定性的问题,并且满足了对海量数据进行分析的要求。EDA的特点是对数据来源的总体不作假设,并且假设检验也经常被排除在外。这一技术使用统计图表、图形和统计概况的方法对数据的特征进行分析和描述,技术核心是“让数据说话”,在...