计量地理学第三章统计分析方法1相关分析ppt课件

上传人:我*** 文档编号:148664017 上传时间:2020-10-21 格式:PPT 页数:48 大小:313.50KB
返回 下载 相关 举报
计量地理学第三章统计分析方法1相关分析ppt课件_第1页
第1页 / 共48页
计量地理学第三章统计分析方法1相关分析ppt课件_第2页
第2页 / 共48页
计量地理学第三章统计分析方法1相关分析ppt课件_第3页
第3页 / 共48页
计量地理学第三章统计分析方法1相关分析ppt课件_第4页
第4页 / 共48页
计量地理学第三章统计分析方法1相关分析ppt课件_第5页
第5页 / 共48页
点击查看更多>>
资源描述

《计量地理学第三章统计分析方法1相关分析ppt课件》由会员分享,可在线阅读,更多相关《计量地理学第三章统计分析方法1相关分析ppt课件(48页珍藏版)》请在金锄头文库上搜索。

1、第三章统计分析方法,1地理要素间的相关分析 2地理要素间的回归分析 3 时间序列分析法 4 系统聚类分析方法 5 主成分分析方法 6 马尔可夫预测方法 7地理系统的空间趋势面分析,1地理要素间的相关分析,地理相关的意义 地理相关程度的度量方法 相关系数的显著性检验 多要素间相关程度的测度,地理要素之间的相关分析的任务,是揭示地理要素之间相互关系的密切程度。而地理要素之间相互关系的密切程度的测定,主要是通过对相关系数的计算与检验来完成的,一、地理相关的意义,相关与地理相关 相关是指两个或两个以上变数间相互关系是否密切。在研究这种关系时并不专指哪一个是自变量,哪一个是因变量,而视实际需要确定。相关

2、分析仅限于测定两个或两个以上变数具有相关关系者,其主要目的是计算出表示两个或两个以上变数间的相关程度和性质 地理相关,就是应用相关分析法来研究各地理要素间的相互关系和联系强度的一种度量指标,地理要素间的关系 函数关系:确定性的关系,这种关系在地理各要素间较少见,这是因为许多地理要素的变化具有随机性的缘故; 相关关系:即要素间既存在密切的关系,但又不能由一个(或几个)要素(或变量)的值明确地求出另一个要素(变量)的值,二、地理相关程度的度量方法,(一)简单直线相关程度的度量 相关程度 研究两个地理要素之间的相互关系是否密切 相关方向 正相关:y值随x的增加而变大或随x的减少而变小 负相关:y值随

3、x的增加而变小或随x的减少而增大,1、一般常用相关系数的计算,rxy为要素x与y之间的相关系数,它就是表示该两要素之间相关程度的统计指标,其值在-1,1区间之内 rxy0,表示正相关,即两要素同向发展 rxy0,表示负相关,即两要素异向发展 rxy 的绝对值越接近于1,表示两要素的关系越密切; 越接近于0,表示两要素的关系越不密切,举例,北京市多年各月平均气温与5cm深的平均地温,如表所示,请计算两者的相关系数,用导出公式,相关系数计算表,伦敦的月平均气温与降水量,资料来源:http:/www.cwb.gov.tw/V4/climate/wta_station/wta20.htm,相关分析实例

4、,根据表3.1.1中的数据,我们可以利用公式(3.1.1),计算伦敦市月平均气温(T)与降水量(P)之间的相关系数: 计算结果表明,伦敦市的月平均气温(t)与降水量(p)之间呈负相关,即异向相关。,计算结果表明,降水量(p)和纬度(y)之间异向相关,而蒸发量(v)与纬度(y)之间同向相关。,相关系数的检验:,相关系数是根据要素之间的样本值计算出来,它随着样本数的多少或取样方式的不同而不同,因此它只是要素之间的样本相关系数,只有通过检验,才能知道它的可信度。 检验是通过在给定的置信水平下,查相关系数检验的临界值表来实现的。,表3.1.3 检验相关系数 的临界值( )表,检验相关系数0的临界值(r

5、)表 左边的f 值称为自由度,其数值为f=n-2,这里n 为样本数;上方的代表不同的置信水平;表内的数值代表不同的置信水平下相关系数=0 的临界值,即ra;公式p=r r = 的意思是当所计算的相关系数r 的绝对值大于在a 水平下的临界值r 时,两要素不相关(即=0)的可能性只有a。 一般而言,当rr时,则认为两要素不相关,这时的样本相关系数就不能反映两要素之间的关系,(1)对伦敦市月平均气温(T)与降水量(P)之间的相关系数,f=12-2=10,在显著性水平 上,查表3.1.3,得知: 。因为 ,所以,伦敦市月平均气温(T)与降水量(P)之间的相关性并不显著。,2、顺序(等级)相关系数计算,

6、n代表样本个数,代表不同的置信水平,也称显著水平,表中的数值为临界值 。,秩相关系数的检验,表3.1.5 秩相关系数检验的临界值,在上例中,n=31,表中没有给出相应的样本个数下的临界值 ,但是同一显著水平下,随着样本数的增大,临界值 减少。在n=30时,查表得: 0.432,由于 =0. 806 0.432,所以在=0.01的置信水平上来看,中国大陆各省(直辖市、自治区)人口规模与GDP是等级相关的。,(二)简单非线性相关程度的度量 表示简单非线性相关程度的统计量,通常用相关指数Ryx来度量,相关指数的性质,随相关曲线形状的不同而异: 相关指数的分布范围介于0到1之间,即0 Ryx 1 相关

7、指数的值大,两个要素(变量)间的相关程度越密切。当Ryx1时,表示两个要素间为完全曲线相关;当Ryx0时,表示两个要素间为完全无曲线相关 相关指数必大于或至少等于用同一批资料所求得的相关系数的绝对值,即Ryxr Ryx的性质与上述情况基本相同,但在通常情况下, Ryx与Rxy不相等,仅当完全相关或完全无关时,两者才相等,(三)多要素相关与相关矩阵 如果问题涉及到多个要素(n个),则对于其中任何两个要素xi和xj ,都可以按照下面的公式计算。得到多要素的相关系数矩阵,多要素的相关系数矩阵 对角线数值为1的对称矩阵,三、多要素间相关程度的测度,地理系统是一种多要素的复杂巨系统,其中一个要素的变化必

8、然影响到其它各要素的变化。在多要素所构成的地理系统中,当我们研究某一个要素对另一个要素的影响或相关程度时,把其它要素的影响视为常数(保持不变),即暂不考虑其它要素的影响,而单独研究那两个要素之间的相互关系的密切程度时,则称为偏相关。用以度量偏相关程度的统计量,称为偏相关系数,(一)偏相关系数的计算与检验,1.偏相关系数的计算 定义:在多要素所构成的地理系统中,先不考虑其它要素的影响,而单独研究两个要素之间的相互关系的密切程度,这称为偏相关。用以度量偏相关程度的统计量,称为偏相关系数 偏相关系数,可利用单相关系数来计算。假设有三个要素x1,x2,x3,其两两间单相关系数矩阵为,因为相关系数矩阵是

9、对称的,故在实际计算时,只要计算出r12,r13 和r23即可。在偏相关分析中,常称这些单相关系数为零级相关系数。对于上述三个要素x1,x2,x3,它们之间的偏相关系数共有三个,即r123,r132,r231(下标点后面的数字,代表在计算偏相关系数时,保持不变量,如r123 即表示x3 保持不变),一级偏相关系数(三个要素),二级偏相关系数(四个要素),例如:对于某四个地理要素x1,x2,x3,x4的23个样本数据,经过计算得到了如下的单相关系数矩阵:,利用公式计算一级偏向关系数,如表所示:,利用公式计算二级偏相关系数,如表所示:,说明:四个要素的一级偏相关系数有12个,这里给出了9个;二级偏

10、相 关系数有6个,这里全部给出来了。,表 一级偏相关系数,表 二级偏相关系数,偏相关系数的性质,偏相关系数具有下述性质: 偏相关系数分布的范围在-1 到1 之间,如当r123 为正值时,表示在X3固定时,X1 与X2 之间为正相关;当r123 为负值时,表示在X3 固定时,X1 与X2 之间为负相关。 偏相关系数的绝对值越大,表示其偏相关程度越大。例如,r123=1,则表示当X3 固定时,X1 与X2 之间完全相关;当r123=0 时,表示当X3 固定时,X1 与X2 之间完全无关 偏相关系数的绝对值必小于或最多等于由同一系列资料所求得的复相关系数(详见后述),即R123r123,2.偏相关系

11、数的显著性检验 偏相关系数的显著性检验,一般采用t-检验法。其统计量计算公式为 r1234m 为偏相关系数,n 为样本数,m 为自变量个数,譬如,偏相关系数r2413=0.821,由于n=23,m=3 查t分布表,可得出不同显著水平上的临界值t,若tt。则表示偏相关显著;反之,tt,则偏相关不显著。在自由度为23-3-1=19 时,查表得t0.001=3.883,所以t t ,这表明在置信度水平a=0.001 上,偏相关系数r2413是显著的,(二)复相关系数的计算与检验,1.复相关系数的计算 复相关系数:反映几个要素与某一个要素之间 的复相关程度 。 复相关系数,可以利用单相关系数和偏相关系

12、数求得 设Y 为因变量,X1,X2,Xk 为自变量,则将Y 与X1,X2,Xk 之间的复相关系数记为Ry12k。其计算公式如下 当有两个自变量时,当有3个自变量时 当有k个自变量时,关于复相关系数的性质,可以概括为如下几点: 复相关系数介于0 到1 之间,即 0Ry12k1 复相关系数越大,则表明要素(变量)之间的相关程度越密切。复相关系数为1,表示完全相关;复相关系数为0,表示完全无关 复相关系数必大于或至少等于单相关系数的绝对值,2.复相关系数的显著性检验(F检验法) n为样本数,K为自变量个数,如R4123=0.974,n=23,k=3,故,查F-检验的临界值表(见本书附表六),可以得出不同显著水平上的临界值F 若FF0.01,则表示复相关在置信度水平a=0.01 上显著,称为极显著 若F0.05FF0.01,则表示复相关在置信度水平a=0.05 上显著 若F0.10FF0.05,则表示复相关在置信度水平a=0.10 上显著 若FF0.10,则表示复相关不显著,即因变量Y 与K 个自变量之间的关系不密切。在上例中,F=120.190 7F0.01=5.0103,故复相关达到了极显著水平,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号