计量地理学中的经典统计分析方法ppt

上传人:tia****nde 文档编号:71445045 上传时间:2019-01-20 格式:PPT 页数:206 大小:1.90MB
返回 下载 相关 举报
计量地理学中的经典统计分析方法ppt_第1页
第1页 / 共206页
计量地理学中的经典统计分析方法ppt_第2页
第2页 / 共206页
计量地理学中的经典统计分析方法ppt_第3页
第3页 / 共206页
计量地理学中的经典统计分析方法ppt_第4页
第4页 / 共206页
计量地理学中的经典统计分析方法ppt_第5页
第5页 / 共206页
点击查看更多>>
资源描述

《计量地理学中的经典统计分析方法ppt》由会员分享,可在线阅读,更多相关《计量地理学中的经典统计分析方法ppt(206页珍藏版)》请在金锄头文库上搜索。

1、第3章 地理学中的经典 统计分析方法,本章主要内容,相关分析 回归分析 时间序列分析 系统聚类分析 主成分分析 趋势面分析方法 马尔可夫预测方法,第1节 相关分析,相关分析的任务,是揭示地理要素之间相互关系的密切程度。而地理要素之间相互关系密切程度的测定,主要是通过对相关系数的计算与检验来完成的。,本节主要内容:,两要素之间相关程度的测定 多要素间相关程度的测定,一、两要素之间相关程度的测定,相关系数的计算与检验 秩相关系数的计算与检验,相关系数的计算 定义: 和 为两要素的平均值。,说明 :- 1 = = 1, 大于0时正相关,小于0时负相关。 的绝对值越接近于1,两要素的关系越密切;越接近

2、于0,两要素的关系越不密切。,简化: 记 公式(3.1.1)可简化为,(3.1.2),表3.1.1 伦敦的月平均气温与降水量,资料来源:http:/www.cwb.gov.tw/V4/climate/wta_station/wta20.htm,相关分析实例,(1)根据表3.1.1中的数据,我们可以利用公式(3.1.1),计算伦敦市月平均气温(t)与降水量(p)之间的相关系数 (2)计算结果表明,伦敦市的月平均气温(t)与降水量(p)之间呈负相关,即异向相关。,又如:根据甘肃省53个气象台站的多年平均数据(见教材表3.1.2),可以利用公式(3.1.1)对降水量(p)和纬度(y)之间的相关系数以

3、及蒸发量(v)和纬度(y)之间的相关系数进行计算,结果如下,计算结果表明,降水量(p)和纬度(y)之间异向相关,而蒸发量(v)与纬度(y)之间同向相关。,相关系数的检验,相关系数是根据要素之间的样本值计算出来,它随着样本数的多少或取样方式的不同而不同,因此它只是要素之间的样本相关系数,只有通过检验,才能知道它的可信度。 检验是通过在给定的置信水平下,查相关系数检验的临界值表来实现的。,表3.1.3 检验相关系数 的临界值( )表,在表3.1.3中, f 称为自由度 ,其数值为 f=n-2,n为样本数;上方的 代表不同的置信水平;表内的数值代表不同的置信水平下相关系数 的临界值,即 ;公式 的意

4、思是当所计算的相关系数 的绝对值大于在 水平下的临界值 r时,两要素不相关(即 )的可能性只有 。,对伦敦市月平均气温(t)与降水量(p)之间的相关系数,f=12-2=10,在显著性水平 上,查表3.1.3,得知: 。 因为 ,所以,伦敦市月平均气温(t)与降水量(p)之间的相关性并不显著。,对于甘肃省53个气象台站降水量(p)和纬度(y)之间的相关系数,以及蒸发量(v)和纬度(y)之间的相关系数,f=53-2=51,表中没有给出相应样本个数下的临界值 ,但是我们发现,在同一显著水平下,随着样本数的增大,临界值 减少。在显著性水平=0.001上,取f=50,查表3.1.3得知: =0.443

5、3。显然, 和 的绝对值都远远大于 =0.443 3,这说明甘肃省53个气象台站降水量(p)和纬度(y)之间,以及蒸发量(v)和纬度(y)之间都是高度相关的。,秩相关系数 又称等级相关系数,或顺序相关系数,是将两要素的样本值按数据的大小顺序排列位次,以各要素样本值的位次代替实际数据而求得的一种统计量。,(3.1.4),(二)秩相关系数的计算与检验,教材中表3.1.4给出了2003年中国大陆各省(直辖市、自治区)的GDP(x)和总人口(y)数据及其位次,将数据代入公式(3.1.4),就可以计算它们之间的秩相关系数 即:GDP(x)与总人口( y )之间的等级相关系数为0.784 7。,示例:,注

6、:n代表样本个数,代表不同的置信水平,也称显 著水平,表中的数值为临界值 。,秩相关系数的检验,表3.1.5 秩相关系数检验的临界值,在上例中,n=31,表中没有给出相应的样本个数下的临界值 ,但是同一显著水平下,随着样本数的增大,临界值 减少。在n=30时,查表得: 0.432,由于 =0.784 7 0.432,所以在=0.01的置信水平上来看,中国大陆各省(直辖市、自治区)人口规模与GDP是等级相关的。,二、多要素间相关程度的测定,偏相关系数的计算与检验 复相关系数的计算与检验,(一)偏相关系数的计算与检验, 定义:在多要素所构成的地理系统中,先不考虑其他要素的影响,而单独研究两个要素之

7、间的相互关系的密切程度,这称为偏相关。用以度量偏相关程度的统计量,称为偏相关系数。,偏相关系数的计算, 计算: 3个要素的偏相关系数,4个要素的偏相关系数,(3.1.8),(3.1.9),(3.1.10),(3.1.11),例如:对于某4个地理要素x1,x2,x3,x4的23个样本数据,经过计算得到了如下的单相关系数矩阵:,利用公式计算一级偏向关系数,如表3.1.6所示:,利用公式计算二级偏相关系数,如表3.1.7所示:,4个要素的一级偏相关系数有12个,这里给出了9个;二级偏相关系数有6个,这里全部给出来了。,表3.1.6 一级偏相关系数,表3.1.7 二级偏相关系数,偏相关系数的性质, 偏

8、相关系数分布的范围在-1到1之间; 偏相关系数的绝对值越大,表示其偏相关程度越大; 偏相关系数的绝对值必小于或最多等于由同一系列资料所求得的复相关系数,即 R123|r123|。,偏相关系数的显著性检验,偏相关系数的显著性检验,一般采用t检验法。其统计量计算公式为,式中: 为偏相关系数;n为样本数;m为自变量个数。,(3.1.14),查t分布表,在自由度为23-3-1=19时,t0.001=3.883,显然 ,这表明在置信度水平 =0.001上,偏相关系数r2413是显著的。,譬如,对于上例计算得到的偏相关系数 ,由于n=23,m=3,故,(二)复相关系数的计算与检验,复相关系数:反映几个要素

9、与某一个要素之间的复相关程度 。 复相关系数的计算 当有两个自变量时 当有三个自变量时,(3.1.15),(3.1.16),当有k个自变量时,(3.1.17),复相关系数的性质 复相关系数介于0到1之间,即, 复相关系数越大,则表明要素(变量)之间的相关程度越密切。复相关系数为1,表示完全相关;复相关系数为0,表示完全无关。 复相关系数必大于或至少等于单相关系数的绝对值。 复相关系数的显著性检验 F检验法。其统计量计算公式为,(3.1.18),例题:在上例中,若以x4为因变量,x1,x2,x3为自变量,试计算x4与x1,x2,x3之间的复相关系数。,解:按照公式(3.1.16)计算 检验: ,

10、故复相关达到了极显著水平。,第2节 回归分析,一元线性回归模型 多元线性回归模型 非线性回归模型,一、一元线性回归模型,定义:假设有两个地理要素(变量)x 和y,x为自变量,y为因变量。则一元线性回归模型的基本结构形式为 式中:a和b为待定参数; 为各组观测数据的下标; 为随机变量。,(3.2.1),记 和 分别为参数a与b的拟合值,则一元线性回归模型为 (3.2.2)式代表x与y之间相关关系的拟合直线,称为回归直线; 是y的估计值,亦称回归值。,(3.2.2), 参数a与b的最小二乘拟合原则要求yi与 的误差ei的平方和达到最小,即 根据取极值的必要条件,有,(3.2.3),(3.2.5),

11、(3.2.6), 解上述正规方程组(3.2.4)式,得到参数a与b的拟合值,(二)一元线性回归模型的显著性检验 方法:F 检验法。 总的离差平方和:在回归分析中,表示y的n次观测值之间的差异,记为 可以证明,(3.2.9),(3.2.8),在式(3.2.9)中,Q称为误差平方和,或剩余平方和 而 称为回归平方和。, 统计量F F越大,模型的效果越佳。统计量FF(1,n-2)。在显著水平下,若FF,则认为回归方程效果在此水平下显著。一般地,当FF0.10(1,n-2)时,则认为方程效果不明显。,(3.2.10),二、多元线性回归模型,回归模型的建立 多元线性回归模型的结构形式为,(3.2.11)

12、,式中: 为待定参数; 为随机变量。, 回归方程: 如果 分别为式(3.2.11)中 的拟和值,则回归方程为 在(3.2.12)式中,b0为常数,b1,b2,bk称为偏回归系数。偏回归系数的意义是,当其他自变量都固定时,自变量 每变化一个单位而使因变量平均改变的数值。,(3.2.12), 偏回归系数的推导过程:根据最小二乘法原理, 的估计值 应该使 由求极值的必要条件得 方程组(3.2.14)式经展开整理后得,(3.2.13),(3.2.14),方程组(3.2.15)式称为正规方程组。 引入矩阵,(3.2.15),则正规方程组(3.2.15)式可以进一步写成矩阵形式,求解得 引入记号,(3.2

13、.16),正规方程组也可以写成,回归模型的显著性检验, 回归平方和U与剩余平方和Q: 回归平方和 剩余平方和为 F统计量为 计算出来F之后,可以查F分布表对模型进行显著性检验。,非线性关系线性化的几种情况 对于指数曲线 ,令 , 可以将其转化为直线形式: , 其中, ; 对于对数曲线 ,令 , ,可以将其转化为直线形式: ; 对于幂函数曲线 ,令 , ,可以将其转化为直线形式: 其中, ;,三、非线性回归模型,对于双曲线 ,令 ,转化为直线形式: ; 对于S型曲线 ,可 转化为直线形式: ; 对于幂乘积 ,只要令 ,就可以将其转化为线性形式 其中, ;,对于对数函数和 只要令 ,就可以将其化为

14、线性形式 例:表3.2.1给出了某地区林地景观斑块面积(area)与周长(perimeter)的数据。下面我们建立林地景观斑块面积A与周长P之间的非线性回归模型 。,表3.2.1 某地区各个林地景观斑块面积(m2)与周长(m),解:(1)作变量替换,令: , ,将表3.2.1中的原始数据进行对数变换,变换后得到的各新变量对应的观测数据如表3.2.2所示。,表3.2.2 经对数变换后的数据,(2) 以x为横坐标、y为纵坐标,在平面直角坐标系中作出散点图。很明显,y与x呈线性关系。,图3.2.2 林地景观斑块面积(A)与周长(P) 之间的双对数关系,(3)根据所得表中的数据,运用建立线性回归模型的方法,建立y与x之间的线性回归模型,得到 对应于(3.2.19)式,x与y的相关系数高 达 =0.966 5。 (4)将(3.2.19)还原成双对数曲线,即,(3.2.19),(3.2.20),第3节 时间序列分析,时间序列分析的基本原理 趋势拟合方法 季节变动预测,一、时间序列分析的基本原理,(一)时间序列的组合成份 长期趋势(T) 是指时间序列随时间的变化而逐渐增加或减少的长期变化的趋势。 季节变动(S) 是指时间序列在一年中或固定时间内,呈现出的固定规则的变动。 循环变动(C) 是指沿着趋势线如钟摆般地循环变动,又称景气循环变动(business cycle movement) 。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号