《第七章空间数据的统计分析3本6教学教材》由会员分享,可在线阅读,更多相关《第七章空间数据的统计分析3本6教学教材(141页珍藏版)》请在金锄头文库上搜索。
1、第七章第七章 空间数据的统计分析方法空间数据的统计分析方法(3)武汉大学遥感信息工程学院遥感科学与技术本科生教案武汉大学遥感信息工程学院遥感科学与技术本科生教案(2012)秦秦 昆昆2地统计分析概述空间变异函数克里金估计方法地统计分析研究展望ArcGIS的地统计分析工具主要内容主要内容3地统计分析概述5国内的地统计工作主要集中于地地质质勘探建模勘探建模和地理地理(环环境境)空空间间数据分析数据分析应用方面。国际上,地统计不仅是地质领域数学地质的主要分支,同时也逐渐成为数学领域应用统计的一个新分支。地地统计统计学学(Geostatistics) ,也称为地地质统计质统计学学,是一门以区域化变量理
2、论为基础,以变异函数为主要工具,研究那些分布于空间上既有随机性又有既有随机性又有结结构性构性的自然或社会现象的科学。主要包括:区域化区域化变变量的量的变变异函数模型异函数模型、克里金估克里金估计计和随机模随机模拟拟三个主要内容。相对于物理机制建模,地统计是一种分析空间位置(空间结构)相关地学信息的经验性方法(赵鹏大,2004)。地统计分析概述6地理信息是地理空间位置相关的信息。地理信息科学是一门研究地理信息获取、处理和利用中的基本规律的科学,与地统计学存在本质联系。地统计学和地理信息科学存在重叠的研究对象地统计学和地理信息科学存在重叠的研究对象,即地理空间相关信息。地统计学遵从相近相似规律相近
3、相似规律(空间位置相近的地学现象具有相似属性值),这与地理信息分析中的地理学第一定律地理学第一定律(空间相近的地理现象比空间远离的地理现象具有更强的相关性)完全一致。地统计学和地理学第一定律同在20世纪60年代被独立提出。地统计分析概述7尽管地理信息系统中还存在空间自回归模型(空间滞后模型和空间误差模型)、地理加权回归和各种空间结构(空间分布)探索等空间统计分析方法,但是地统计一直是理论基础最为完善且应用扩展最为广但是地统计一直是理论基础最为完善且应用扩展最为广泛的主流空间统计方法,泛的主流空间统计方法,地统计学已经成为地理信息科学中地理信息处理和分析的重要理论,地统计分析功能被直接嵌入或平行
4、连接到地理空间或遥感影像信息系统中。地统计分析概述8地统计具有不同于传统统计的两个显著特点:1 1)样本点的空间相关性)样本点的空间相关性。传统统计中不同样本点仅具有随机性,样本点之间保持空间独立性。然而,地统计中样本点不仅具有随机性,同时样本点之间具有空间相关性。2 2)一次性样本采集。)一次性样本采集。传统统计分析同一空间位置处可以多次采样数据。实际地统计分析中,样本区域中每一个空间位置多为一次采样数据。根据传统统计学,一次采样数据中无法推断出总体规律。这这两个特点导致了地统计中描述空间相关性两个特点导致了地统计中描述空间相关性( (空间结构空间结构) )的变异函的变异函数和克服一次采样局
5、限的平稳性假设的提出。数和克服一次采样局限的平稳性假设的提出。有时候,区域化变量的空间相关(不同空间位置变量的相关)也称为空间自相关,区域化变量的协方差(不同空间位置变量的相关)也称为空间自协方差。地统计分析概述9空间变异函数空间变异函数10区域化变量的定义和平稳性假设区域化变量的定义和平稳性假设当空间被赋予地学含义时,地学工作者习惯称其为区域。发现地表空间的区域差异正是地理学研究的基本任务。当一个专题变量分布于空间,呈现一定的结构性和随机性时,在地统计学上称之为“区域化”,区域化变量(regionalizedvariable)描述的现象为区域化现象。空间变异函数空间变异函数变异函数(区域化变
6、量的定义和平稳性假设)变异函数(区域化变量的定义和平稳性假设)定定义义:设设Z(x)为为一随机一随机变变量,表示在空量,表示在空间间位置位置x处专题变处专题变量取量取值值是随机的,区域化是随机的,区域化变变量是区域化随机量是区域化随机变变量的量的简简称。称。Z(X)=Z(x), x X表示区域表示区域X中所有空中所有空间间位置位置x处处随机随机变变量量Z(x)的集合的集合(簇簇),又称,又称为为随机场随机场,随机场也可看作若干空间样,随机场也可看作若干空间样本(空间函数)的集合。本(空间函数)的集合。1112区域化变量即空间位置相关的随机变量。区域化变量为具有内在空间结构的随机变量,它是随机场
7、的简化。随着抽象层次的提升或观察尺度的加大,一个复杂结构的空间单元逐步简化为一个简单的空间位置点。区域化变量理论重点研究区域化随机变量的各种空间结构和统计性质,变异函数是描述区域化随机变量空间结构的有效数学工具,克里金估计利用区域化变量结构性质进行估值应用。估计是数据处理的一种泛称。在时间域,服务于不同目的估计分别称为滤波(除去噪音)、平滑(找出趋势)和预测(计算未来值)。在空间域,估计可以分为内插(计算研究区域内的未知值)和外推(计算研究区域外的未知值,又称为预测)。克里金插值和克里金预测统称为克里金估计。揭示区域化变量空间结构和统计性质的理论,简称为区域化变量理论,构成了地统计学的基础。变
8、异函数(区域化变量的定义和平稳性假设)变异函数(区域化变量的定义和平稳性假设)n地地统计统计中的数据多中的数据多为为区域中每个空区域中每个空间间位置的一次采位置的一次采样样数据。数据。通常,通常,为为了了满满足足总总体体规规律推断中多个律推断中多个样样本本(大大样样本本)的数据要的数据要求,地求,地统计统计中使用平中使用平稳稳(second-order stationary)或内或内蕴蕴(intrinsic stationary)假假设设下多个空下多个空间间位置采位置采样样数据数据(每个位置每个位置依然是一次采依然是一次采样样数据数据)来替代来替代单单个位置上的多次采个位置上的多次采样样数据数
9、据(传传统统计统统计的采的采样样数据数据)。n机理上,相近相似机理上,相近相似规规律的普适性、空律的普适性、空间结间结构的构的稳稳定性、地学定性、地学现现象空象空间结间结构形成的构形成的驱动驱动(动动力力)因素的不因素的不变变性等表明了平性等表明了平稳稳性假性假设设的的现实现实合理性。合理性。13变异函数(区域化变量的定义和平稳性假设)变异函数(区域化变量的定义和平稳性假设)变异函数(区域化变量的定义和平稳性假设)变异函数(区域化变量的定义和平稳性假设)存在存在n个随机个随机变变量的量的联联合分布合分布F(Z(x1), Z(x2), , Z(xn),严格的严格的平稳性平稳性指随机变量联合分布的
10、空间位移不变性,即:指随机变量联合分布的空间位移不变性,即:F(Z(x1), Z(x2), , Z(xn) = F(Z(x1+h), Z(x2+h), , Z(xn+h)实际应用中,满足这种位移不变的联合概率分布的区域化随机实际应用中,满足这种位移不变的联合概率分布的区域化随机变量较少见,而且严格平稳性的验证非常困难。变量较少见,而且严格平稳性的验证非常困难。相比较,容易满足和验证的是分布参数相比较,容易满足和验证的是分布参数(矩矩)的平稳性,即弱平的平稳性,即弱平稳性假设。稳性假设。常用的弱平稳性假设包括二阶平稳性和内蕴性假设。二阶平稳常用的弱平稳性假设包括二阶平稳性和内蕴性假设。二阶平稳性
11、是比内蕴性更严格的若性是比内蕴性更严格的若(弱弱)平稳性假设。平稳性假设。14变异函数(区域化变量的定义和平稳性假设)变异函数(区域化变量的定义和平稳性假设)定定义义:如果区域化:如果区域化变变量量Z(x)满满足下列两个条件,足下列两个条件,则则称其称其满满足足二二阶平稳性假设。阶平稳性假设。(1)在研究范围内,区域化变量)在研究范围内,区域化变量Z(x)的期望存在且为常数,的期望存在且为常数,即即 EZ(x)=m(2)在研究范围内,区域化变量)在研究范围内,区域化变量Z(x)的协方差函数存在且为的协方差函数存在且为空间滞后空间滞后h的函数,与空间位置的函数,与空间位置x无关,即无关,即 Co
12、vZ(x), Z(x+h)=EZ(x+h)-mZ(x)-m= EZ(x+h) Z(x)-m2=C(h)当当h=0时,条件(时,条件(2)说明了方差函数存在且为常数,)说明了方差函数存在且为常数,VarZ(x)=CovZ(x), Z(x)=EZ(x)-m2=C(0)15变异函数(区域化变量的定义和平稳性假设)变异函数(区域化变量的定义和平稳性假设)二阶平稳性假设中要求区域化变量的期望、协方差和方差都存二阶平稳性假设中要求区域化变量的期望、协方差和方差都存在,实际中区域化变量的先验期望可能不存在,但是变异函数在,实际中区域化变量的先验期望可能不存在,但是变异函数存在。存在。定义在区域化变量相对增量
13、上的变异函数具有比定义在区域化定义在区域化变量相对增量上的变异函数具有比定义在区域化变量绝对值上的协方差函数的条件更加宽松,变异函数的计算变量绝对值上的协方差函数的条件更加宽松,变异函数的计算比协方差函数的计算更加容易。比协方差函数的计算更加容易。协方差函数和变异函数为空间结构的对偶描述方式。对于区域协方差函数和变异函数为空间结构的对偶描述方式。对于区域化变量,协方差函数从相似角度来描述空间结构,变异函数则化变量,协方差函数从相似角度来描述空间结构,变异函数则从差异角度描述空间结构。从差异角度描述空间结构。16变异函数(区域化变量的定义和平稳性假设)变异函数(区域化变量的定义和平稳性假设)定定
14、义义:如果区域化:如果区域化变变量量Z(x)满满足下列两个条件,足下列两个条件,则则称其称其满满足足内内蕴性假设。蕴性假设。(1)在研究范围内,区域化变量)在研究范围内,区域化变量Z(x)增量的期望为零,即增量的期望为零,即EZ(x+h)-Z(x)=0(2)在研究范围内,区域化变量)在研究范围内,区域化变量Z(x)增量的方差存在且为空增量的方差存在且为空间滞后间滞后h的函数,与空间位置的函数,与空间位置x无关,即无关,即 VarZ(x+h)-Z(x)=EZ(x+h)-Z(x)-EZ(x+h)-Z(x)2=EZ(x+h)-Z(x)2=2 (h) 这里,这里, (h)表示区域化变量的变异函数或半方
15、差函数。表示区域化变量的变异函数或半方差函数。有些文献也将有些文献也将 (h)称为半变异函数或半变差函数。称为半变异函数或半变差函数。可以看出,区域化变量增量的计算避免了期望的直接计算。变可以看出,区域化变量增量的计算避免了期望的直接计算。变异函数对区域化变量的期望的存在没有直接要求。异函数对区域化变量的期望的存在没有直接要求。17变异函数的定义和非负定性条件变异函数的定义和非负定性条件定义:变异函数是区域化变量空间结构的一种形式化表达,数学表示为两个随机变量Z(x)和Z(x+h)之间增量的方差的一半,1819进一步表达式变换为:变异函数的定义和非负定性条件变异函数的定义和非负定性条件n以上协
16、方差函数和变异函数关系式更加清晰地表明,协方差以上协方差函数和变异函数关系式更加清晰地表明,协方差函数和变异函数为空间结构的对偶描述方式。函数和变异函数为空间结构的对偶描述方式。n对于区域化变量,协方差函数从相似角度来描述空间结构,对于区域化变量,协方差函数从相似角度来描述空间结构,变异函数则从差异角度描述空间结构。变异函数则从差异角度描述空间结构。n二阶平稳性假设下,协方差函数和变异函数存在相互转换关二阶平稳性假设下,协方差函数和变异函数存在相互转换关系。系。20变异函数的定义和非负定性条件变异函数的定义和非负定性条件n在协方差函数和变异函数中,如果空间滞后在协方差函数和变异函数中,如果空间滞后h以极坐标参考以极坐标参考系中的矢量表示,则该滞后矢量有模和方向两个特征量。系中的矢量表示,则该滞后矢量有模和方向两个特征量。n当协方差函数和变异函数仅为模值当协方差函数和变异函数仅为模值|h|的函数时,称其为各的函数时,称其为各向同性协方差函数和变异函数。向同性协方差函数和变异函数。n否则,当协方差函数和变异函数同时为模值否则,当协方差函数和变异函数同时为模值|h|和方向的函和方向的函数时,