第4章空间统计分析课件

举报
资源描述
第4章 空间统计分析4.1 空间自相关Spatial autocorrelation 空间统计分析,即空间数据的统计分析,通过空间位置建立数据间的统计关系。空间统计学产生的原因:大多数经典统计学分析要求样本相互独立,而空间数据间并非完全独立,而是存在依赖性。空间统计分析可包括“空间数据的统计分析”及“数据的空间统计分析”本节内容:1 空间分布模式2 空间权重矩阵(空间接近性矩阵)3 全域型空间自相关指标4 区域型空间自相关指标1 空间分布模式 在研究某一变量的空间分布模式时,我们希望将所观测到的模式与某一理论模式(统计特性及相关空间过程已知)进行比较。如果所研究的空间模式符合某一特定的理论模式,我们就可以运用该理论模式的已知性质来解释观测到的模式,并且能够借用我们所拥有的与该已知模式相关的经验和知识来进行深入的研究。空间分布模式可以划分为聚集模式(clustered pattern)、分散模式(dispersed pattern)和随机模式(random pattern)三类。聚集模式分散模式随机模式 真实世界中的大部分模式都介于随机与分散模式或随机与聚集模式之间,极少能遇到极端聚集、极端分散或极端随机的模式。既然现实模式很难轻易归入聚集、分散或随机型,那么我们就要考虑某一给定的空间模式与这三种模式中的某一种到底有多接近?如果它接近其中的一种模式,那么这种接近到底是有偶然因素还是系统过程造成的?我们在分析某变量的空间分布模式时,实际上是在测度空间自相关程度或者说空间依赖程度。空间自相关是指属性值在空间上相关是由要素的地理位置造成的。对于任何空间变量(属性)z,空间自相关测度的是z的近邻值对于z的相似或不相似程度。如果近邻位置上相互间的数值接近,我们就说空间模式表现出的是正空间自相关;如果相互间的数值不接近,我们说空间模式表现出的是负空间自相关。地级市 人均GDPx1 第三产比重%x2许昌 13036720郑州 24900040.2洛阳 33600031.8南阳 41900027.5平顶山 52600025焦作 63570023.2周口 71300024.8安阳 82500026.2新乡 92200028.6商丘 101500029.1信阳 111400031.4驻马店121200030.7开封 131800033.3三门峡143600023.5濮阳 152100019.6漯河 162600017.5鹤壁 172900018济源 185020019.7均值2651426.1标准差114206.076 空间自相关是根据位置相似性和属性相似性的匹配情况来测度的。位置的相似性可以通过空间接近性矩阵(或权重矩阵)W来描述;属性的相似性一般通过交叉乘积xixj,或平方差异(xi-xj)2,或绝对差异xi-xj来描述。本节内容:1 空间分布模式2 空间权重矩阵(空间接近性矩阵)3 全域型空间自相关指标4 区域型空间自相关指标 基于“距离”的空间接近性测度就是使用面积单元之间的距离定义接近性。如何测度任意两个面积单元之间的距离呢?按照面积单元之间是否有邻接关系的邻接法;基于面积单元中心距离的重心距离法。2 空间权重矩阵(空间接近性矩阵)空间权重矩阵是空间接近性的定量化测度。式中:Wij表示区域i与j的临近关系,它可以根据邻接标准或距离标准来度量。假设研究区有n个多边形,任何两个多边形都存在一个空间关系,这样就有nn对关系,需要nn的矩阵存储这n个单元之间的空间关系。2.1 简单的二进制邻接矩阵 123456789123456789车的行走方式王、后的行走方式2.2 基于距离的二进制空间权重矩阵 100km空间自相关按功能大致分为两类:全域型空间自相关(Global Spatia Autocorrelation)区域型空间自相关(Local Spatia Autocorrelation)本节内容:1 空间分布模式2 空间权重矩阵(空间接近性矩阵)3 全域型空间自相关指标4 区域型空间自相关指标3 全域型空间自相关指标 功能在于描述某要素的整体分布情况,判断此现象在空间是否有聚集特性存在,但并不能确切地指出聚集在哪些地区。Moran指数和Geary系数是两个用来度量空间自相关的全局指标。3.1 Morans I 设研究区域中存在n个面积单元,第i个单元上的观测值记为xi,观测变量在n个单元中的均值记为 ,Morans I定义为:-1 I 1 1表示极强的正空间自相关,-1表示极强的负空间自相关。对于Moran指数,可以用标准化统计量Z来检验n个区域是否存在空间自相关关系,Z的计算公式为:当Z值为正且显著时,表明存在正的空间自相关,也就是说相似的观测值(高值或低值)趋于空间集聚;当Z值为负且显著时,表明存在负的空间自相关,相似的观测值趋于分散分布;当Z值为零时,观测值呈独立随机分布。3.2 Geary 系数C 基于相关位置间的数字差分:0 C 2 C1表示负相关,C=1表示不相关,C1表示正相关。3.3 广义G统计量 I和C都具有描述全局空间自相关的良好统计特性,它是它们不具有识别不同类型的空间聚集模式的能力。这些模式有时被称为“hot spots”和“cold spots”。如果高值面积单元相互之间接近,I和C将指示相对高的空间自相关,这些高值面积单元之间的聚集可被标注为“hot spots”。但是I和C指出的高的正空间自相关也可有相互接近的低值面积单元构成,这种类型的聚集可被称为“cold spots”.I和C不能区分这两种类型的空间自相关。广义G统计量采用交叉积的形式,其优势是能检测研究区中的“hot spots”和“cold spots”。当单元i和j的距离小于d时,Wij(d)=1,否则Wij(d)=0本节内容:1 空间分布模式2 空间权重矩阵(空间接近性矩阵)3 全域型空间自相关指标4 区域型空间自相关指标4 区域型空间自相关指标 全域型空间自相关统计量是对整个研究区概括出的统计量。在某些区域上空间自相关值可能是高的,另外一些区域上的值可能是低的,甚至可能在研究区的某一部分中找到正的空间自相关而在另一些区域中找到负的空间自相关。这一现象出现的原因在于空间异质性的存在。对全域测度统计量的适当修正可用于探测局部尺度上的空间自相关。区域空间自相关分析方法包括3种:空间联系的局部指标(LISA);G统计量;Moran散点图。4.1 空间联系的局部指标(LISA)空间联系的局部指标(local indicators of spatial association,缩写为LISA)满足下列两个条件:(1)每个区域单元的LISA,是描述该区域单元周围显著的相似值区域单元之间空间集聚程度的指标;(2)所有区域单元LISA的总和与全局的空间联系指标成比例。LISA包括:局部Moran指数(local Moran)局部Geary指数(local Geary)对于面积单元i,其局部Morans I统计量定义为:局部Moran指数可进一步写成:局部Moran指数检验的标准化统计量为:人均GDP局部Moran指数表河南地级市人均GDP局部Moran指数4.2 G统计量 全局G统计量的计算公式为:对每一个区域单元的统计量为:对统计量的检验与局部Moran指数相似,其检验值为 显著的正值表示在该区域单元周围,高观测值的区域单元趋于空间集聚,而显著的负值表示低观测值的区域单元趋于空间集聚。人均GDP局部G统计量表河南地级市人均GDP局部G统计量4.3 Moran散点图 以(Wz,z)为坐标点的Moran散点图,常来研究局部的空间不稳定性,它对空间滞后因子Wz和z数据对进行了可视化的二维图示。Moran散点图的4个象限,分别对应于区域单元与其邻居之间4种类型的局部空间联系形式:第1象限代表了高观测值的区域单元被同是高值的区域所包围的空间联系形式;第2象限代表了低观测值的区域单元被高值的区域所包围的空间联系形式;第3象限代表了低观测值的区域单元被同是低值的区域所包围的空间联系形式;第4象限代表了高观测值的区域单元被低值的区域所包围的空间联系形式。与局部Moran指数相比,其重要的优势在于能够进一步具体区分区域单元和其邻居之间属于高值和高值、低值和低值、高值和低值、低值和高值之中的哪种空间联系形式。
展开阅读全文
温馨提示:
金锄头文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
相关搜索

当前位置:首页 > 办公文档 > 教学/培训


电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号