第九讲地统计分析方法

上传人:命****币 文档编号:111941737 上传时间:2019-11-04 格式:PPT 页数:53 大小:1.03MB
返回 下载 相关 举报
第九讲地统计分析方法_第1页
第1页 / 共53页
第九讲地统计分析方法_第2页
第2页 / 共53页
第九讲地统计分析方法_第3页
第3页 / 共53页
第九讲地统计分析方法_第4页
第4页 / 共53页
第九讲地统计分析方法_第5页
第5页 / 共53页
点击查看更多>>
资源描述

《第九讲地统计分析方法》由会员分享,可在线阅读,更多相关《第九讲地统计分析方法(53页珍藏版)》请在金锄头文库上搜索。

1、1 基础知识 地统计(Geostatistics)又称地质统计,是在法国著 名统计学家G. Matheron大量理论研究的基础上 逐渐形成的一门新的统计学分支。它是以区域化 变量为基础,借助变异函数,研究既具有随机性 又具有结构性,或空间相关性和依赖性的自然现 象的一门科学。 凡是与空间数据的结构性和随机性,或空间相关性 和依赖性,或空间格局与变异有关的研究,并对 这些数据进行最优无偏内插估计,或模拟这些数 据的离散性、波动性时,皆可应用地统计学的理 论与方法。 地统计分析的核心就是通过对采样数据的分析、对 采样区地理特征的认识选择合适的空间内插方法 创建表面。 2 n前提假设 n随机过程 地

2、统计学认为研究区域中的所有样本值都是随 机过程的结果,即所有样本值都不是相互独 立的,它们是遵循一定的内在规律的。因此 地统计学就是要揭示这种内在规律,并进行 预测。 n正态分布 若不符合正态分布的假设,应对数据进行变换 ,转为符合正态分布的形式,并尽量选取可 逆的变换形式。 3 n平稳性 包括两种平稳性:一类是均值平稳;另一类是与协方差 函数有关的二阶平稳和与半变异函数有关的内蕴平稳 。 均值平稳,即假设均值是不变的并且与位置无关; 二阶平稳是假设具有相同的距离和方向的任意两点的 协方差是相同的,协方差只与这两点的值相关而 与它们的位置无关; 内蕴平稳假设是指具有相同距离和方向的任意两点的

3、方差(即变异函数)是相同的。二阶平稳和内蕴 平稳都是为了获得基本重复规律而作的基本假设 ,通过协方差函数和变异函数可以进行预测和估 计预测结果的不确定性。 4 n区域化变量 n当一个变量呈现一定的空间分布时,称之为区 域化变量,它反映了区域内的某种特征或现象 。 n区域化变量与一般的随机变量不同之处在于, 一般的随机变量取值符合一定的概率分布,而 区域化变量根据区域内位置的不同而取不同的 值。而当区域化变量在区域内确定位置取值时 ,表现为一般的随机变量,也就是说,它是与 位置有关的随机变量。 n区域化变量具有两个显著特征:即随机性和结 构性。 地统计学是以区域化变量理论为基础 ,以变异函数为主

4、要工具,研究那些在空 间分布上既有随机性又有结构性,或空间 相关和依赖性的自然现象的科学。 协方差函数和变异函数是以区域化变 量理论为基础建立起来的地统计学的两个 最基本的函数。地统计学的主要方法之一 ,克立格法就是建立在变异函数理论和结 构分析基础之上的。 (一)协方差函数 n协方差函数的概念 区域化随机变量之间的差异,可以用空间协方差来表示 。 在概率论中,随机向量X与Y的协方差被定义为 E(.)为期望值. 区域化变量在空间点x和x+h处的两个随机变量 和的二阶混合中心矩定义为Z(x)的自协方差函数,即 (4.2.2) (4.2.1) n协方差函数的计算公式 式中:h为两样本点空间分隔距离

5、或距离滞后; 为 在空间位置 处的实测值; 是 在 处距离偏离h的实测值i=1,2, , 是分隔 距离为h时的样本点对(paris)总数, 和 分别为 和 的样本平均数,即 (4.2.3) (4.2.4) (4.2.5) 若 = =m(常数),则上式可 以改写为 式中:m为样本平均数,可由一般算术平 均数公式求得,即 (4.2.6 ) (二)变异函数 n变异函数的概念 变异函数variograms),又称变差函 数、变异矩,是地统计分析所特有的基本 工具。 在一维条件下变异函数定义为,当空 间点x在一维x轴上变化时,区域化变量Z(x) 在点x和x+h处的值Z(x)与Z(x+h)差的方差的 一半

6、为区域化变量Z(x)在x轴方向上的变异 函数,记为(h),即 (4.2.7 ) 方差等于平方均值减去均值的平方 在二阶平稳假设条件下,对任意的h有 因此,公式可以改写为 从上式可知,变异函数依赖于两个自变量 x和h,当变异函数 仅仅依赖于距离h 而与位置x无关时, 可改写成 ,即 (4.2.9) (4.2.8) n变异函数的性质 设Z(x)是区域化变量,在满足二阶平稳 假设条件下,变异函数式具有如下性质: (1) =0,即在h=0处,变异函数为0; (2) = ,即 关于直线h=0是 对称的,它是一个偶函数; (3) 0,即 只能大于或等于0; n变异函数的计算公式 设 是系统某属性Z在空间位

7、置x处 的值, 为一区域化随机变量,并满足二 阶平稳假设,h为两样本点空间分隔距离, 和 分别是区域化变量 在空间 位置 和 处的实测值i=1,2,N(h), 那么,变异函数 的离散计算公式为 (4.2.10) 这样对不同的空间分隔距离h,计算出相 应的 和 值。如果分别以h为横坐标, 或 为纵坐标,画出协方差函数和变异函数曲 线图,就可以直接展示区域化变量Z(x)的空间 变异特点。可见,变异函数能同时描述区域化 变量的随机性和结构性,从而在数学上对区域 化变量进行严格分析,是空间变异规律分析和 空间结构分析的有效工具。 例如:假设某地区降水量Z(x)(单位: mm)是二维区域化随机变量,满足

8、二 阶平稳假设,其观测值的空间正方形网 格数据如图4.2.1所示(点与点之间的距 离为h=1 km)。试计算其南北方向及西 北和东南方向的变异函数。 图4.2.1 空间正方形网格数据(点间距h=1 km) 从图4.2.1可以看出,空间上有些点,由 于某种原因没有采集到。如果没有缺失值, 可直接对正方形网格数据结构计算变异函数 ;在有缺失值的情况下,也可以计算变异函 数。只要“跳过”缺失点位置即可(图4.2.2) 。 首先计算南北方向上的变异函数值,由变 异函数的计算公式可得 =385/72=5.35 图4.2.2 缺失值情况下样本数对的组成和计算过程 为缺失值 同样计算出 最后,得到南北方向和

9、西北东南方向上 的变异函数计算结果见下表。同样可以计算东 西方向上的变异函数。 方向 南北 方向 西北东南 h 12345 h 1.4 1 2.824.245.657.07 N(h ) 36 27 21 13 5 N(h) 32211382 5.3 5 9.2 6 17.5525.6922.907.0 6 12.9530.8558.1350.0 0 n变异函数的参数 变异函数有个非常重要的参数,即基台 值(sill)、变程(range)或称空间依赖范围 (range of spatial dependence)、块金值( nugget)或称区域不连续性值(localized discontin

10、uity)和分维数(fractal dimension) 。 前3个参数可以直接从变异函数图中得到 。它们决定变异函数的形状与结构。 变异函数的形状反映自然现象空间分布结 构或空间相关的类型,同时还能给出这种空间 相关的范围。 当变异函数随着间隔距离h的增大,从非零值达到 一个相对稳定的常数时,该常数称为基台值C0+C。 当间隔距离h=0时,(0)= C0,该值称为块金值或 块金方差(nugget variance)。 基台值是系统或系统属性中最大的变异,变异函 数达到基台值时的间隔距离a称为变程。变程表示在 ha以后,区域化变量Z(x)空间相关性消失。 块金值表示区域化变量在小于抽样尺度时非

11、连续 变异,由区域化变量的属性或测量误差决定。 上述个参数可从变异函数曲线图直接 得到,或通过估计曲线回归参数得到。 第4个参数,即分维数用于表示变异函 数的特性,由变异函数 和间隔距离h之间 的关系确定 分维数D为双对数直线回归方程中的斜 率,它是一个无量纲数。分维数D的大小, 表示变异函数曲线的曲率,可以作为随机变 异的量度。但该随机分维数D与形状分维数 有本质的不同。 n变异函数的理论模型 地统计学将变异函数理论模型分为3大类: 第1类是有基台值模型,包括球状模型、指 数模型、高斯模型、线性有基台值模型和纯块金 效应模型; 第2类是无基台值模型,包括幂函数模型、 线性无基台值模型、抛物线

12、模型; 第3类是孔穴效应模型。 下面有代表性地介绍几种常见的变异函数理 论模型。 纯块金效应模型:其一般公式为 式中:c00,为先验方差。该模型相当 于区域化变量为随机分布,样本点间的协方 差函数对于所有距离h均等于0,变量的空间 相关不存在。 (4.2.11) 球状模型:其一般公式为 式中:c0为块金(效应)常数;c为拱高 ;c0+c为基台值;a为变程。当c0=0,c=1时,称 为标准球状模型。球状模型是地统计分析中 应用最广泛的理论模型,许多区域化变量的 理论模型都可以用该模型去拟合。 (4.2.12) 指数模型:其一般公式为 式中:c0和c意义与前相同,但a不是变程。 当h=3时, ,即

13、 ,从而 指数模型的变程 约为 。当c0=0,c=1时,称 为标准指数模型。 (4.2.13 ) 高斯模型:其一般公式为 式中:c0和c意义与前相同,a也不是变程。当 时, ,即 ,因此高斯模型的 变程 约为 。当 时,称为标准高斯函数 模型。 (4.2.14) 幂函数模型:其一般公式为 式中:为幂指数。当变化时,这种模型可以反 映在原点附近的各种性状。但是必须小于2,若 , 则函数 就不再是一个条件非负定函数了,也就是 说它已经不能成为变异函数了。 (4.2.15) 对数模型:其一般公式为 显然,当 ,这与变异函 数的性质 不符 。因此,对数模型不能 描述点支撑上的区域化变量的结构。 (4.

14、2.16) 线性有基台值模型:其一般公式为 式中:该模型的变程为a,基台值为 。 线性无基台值模型:其一般公式为 从式中可以看出,该模型没有基台值,也没有 变程。 (4.2.18) (4.2.17) 例如:某地区降水量是一个区域化变量,其变 异函数 的实测值及距离h的关系见下表, 下面我们试用回归分析方法建立其球状变异 函数模型。 实测值(h)距离h实测值(h)距离h 2.10.69.24.9 4.31.110.35.1 5.72.210.56.2 6.52.510.97.5 7.83.111.29.5 8.83.812.49.8 从上面的介绍和讨论,我们知道,球状 变异函数的一般形式为 当

15、时,有 如果记 , 则可以得到线性模型 根据表中的数据,对上式进行最小二乘 拟合,得到 (4.2.20) 计算可知,上式的显著性检验参数 F=114.054,R2=0.962,可见模型的拟合效果 是很好的。 (4.2.19) 比较(4.2.20)式与(4.2.19)式,并做简 单计算可知:c0=2.048,c=1.154,a=8.353, 所以,球状变异函数模型为 (4.2.21) (三)克立格插值方法 克立格(Kriging)插值法,又称空间局 部估计或空间局部插值法,是地统计学的主 要内容之一。克立格法是建立在变异函数理 论及结构分析基础之上的,它是在有限区域 内对区域化变量的取值进行无偏最优估计的 一种方法。 克立格法适用的条件是,如果变异函数 和相关分析的结果表明区域化变量存在空间 相关性。 其实质是利用区域化变量的原始数据和 变异函数的结构特点,对未采样点的区域化 变量的取值进行线性无偏、最优估计。 克立格插值(riging interpolation)是根据 变异函数模型而发展起来的一系列地统计的空 间插值方法,包括: 普通克立格法(ordinary riging); 泛克立格法(universal riging); 指示克立格法(indicator riging); 析取克立格法(disjuncti

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件 > 高中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号