空间自相关聚集分析空间自相关聚集分析1陈慈仁、林峰田、何灿群一、概述在统计上,透过相关分析(correlationanalysis)可以检测两种现象(统计量)的变化是否存在相关性,例如:稻米的产量,往往与其所处的土壤肥沃程度相关。若其分析之统计量系为不同观察对象之同一属性变量,则称之为「自相关」(autocorrelation)。是故,所谓的空间自相关(spatialautocorrelation)乃是研究「空间中,某空间单元与其周围单元间,就某种特征值,透过统计方法,进行空间自相关性程度的计算,以分析这些空间单元在空间上分布现象的特性」。b5E2RGbCAP计算空间自相关的方法有许多种,然最为知名也最为常用的有:Moran’sI、Geary’sC、Getis、Joincount等等。但这些方法各有其功用,同时亦有其适用范畴与限制,当然自有其优缺点。一般来说,方法在功用上可大致分为两大类:一为全域型(GlobalSpatialAutocorrelation),另一则为区域型(LocalSpatialAutocorrelation)两种。p1EanqFDPw全域型的功能在于描述某现象的整体分布状况,判断此现象在空间是否有聚集特性存在,但其并不能确切地指出聚集在哪些地区。且若将全域型不同的空间间隔(spatiallag)的空间自相关统计量依序排列,还可进一步作空间自相关系数图(spatialautocorrelationcoefficientcorrelogram),分析该现象在空间上是否有阶层性分布。而依据Anselin(1995)提出LISA(LocalIndicatorsofSpatialAssociation)方法论说法,区域型之所以能够推算出聚集地(spatialhotspot)的范围,主要有两种:一是藉由统计显著性检定的方法,检定聚集空间单元相对于整体研究范围而言,其空间自相关是否够显著,若显著性大,即是该现象空间聚集的地区,如:Getis和Ord(1992)发展的Getis统计方法;另外,则是度量空间单元对整个研究范围空间自相关的影响程度,影响程度大的往往是区域内的「特例」(outliers),也就表示这些「特例」点往往是空间现象的聚集点,例如:Anselin’sMoranScatterplot。DXDiTa9E3d在许多研究案例中,Moran’sI和Getis是最被经常使用的方法。下文将分别介绍之。1改寫自「陳慈仁(2001)台北市資訊軟體業與網際網路服務業區位分佈之研究(第三章)」國立台灣大學建築城鄉研究所碩士論文。RTCrpUDGiT二、全域型Moran’sI法全域型Moran’sI计算方式,是基于统计学相关系数的共变量(covariance)关系推算得来。一般而言,统计学上的变异数与共变量皆是用于数值资料改变程度的度量工具。变异数是一组变量(xi)内部变量的平均单位,以组内各数与平均数(x)差距之平方和,除以总项数而得。其公式如下:5PCzVD7HxA變異數2iiinn而共变量乃是两组数相互变量的平均单位,由其中一组变量的每项(xi),对平均数(x)的差距,而另一组变量的每项(yi),对平均数(y)的差距之相乘积,除以总项数而得。公式如下:jLBHrnAILg共變數iin当(xi-x)与(yi-y)两组数同时为正,或为负时,则(xi-x)(yi-y)必为正,代表两组数变化相同,或大部分方向相同,因此其为正相关。反之,若(xi-x)与(yi-y)分别为一正一负时,则(xi-x)(yi-y)必为负,代表两组数的变化方向不同,因此两组数是呈负相关。此外,(xi-x)(yi-y)的大小,亦受(xi-x)与(yi-y)两组数与其平均数变化有关,两者均大、一大一小,或是两者皆小,都会使得(xi-x)(yi-y)变化甚微,因此共变量的大小程度亦即代表两组数的相关性大小。因此,Moran’sI便基于这种概念发展而出,而全域型的Moran’sI的公式如下:xHAQX74J0Xnijnnnn2n其中,Wij是研究范围内每一个空间单元i与j()区空间单元的空间相邻权重矩阵。以1当作i与j相邻时,而以0表示i与j不相邻。而I的期望值为LDAYtRyKfE其变异数(虚无假设为随机分布)为2其中jnn2n2为空间相临权重矩阵i行W.i为i列依照以上步骤计算出的Moran’sI值结果一定介于-1到1之间,大于0为正相关,小于0为负相关,且值越大表示空间分布的相关性越大,即空间上有聚集分布的现象(如图1)。反之,值越小代表示空间分布相关性小,而当值趋于0时,即代表此时空间分布呈现随机分布的情形。Zzz6ZB2Ltk图1空间自相关正负结果示意图Moran’sI>0(正相...