气象站信息new课件

上传人:我*** 文档编号:141876932 上传时间:2020-08-13 格式:PPT 页数:24 大小:217.50KB
返回 下载 相关 举报
气象站信息new课件_第1页
第1页 / 共24页
气象站信息new课件_第2页
第2页 / 共24页
气象站信息new课件_第3页
第3页 / 共24页
气象站信息new课件_第4页
第4页 / 共24页
气象站信息new课件_第5页
第5页 / 共24页
点击查看更多>>
资源描述

《气象站信息new课件》由会员分享,可在线阅读,更多相关《气象站信息new课件(24页珍藏版)》请在金锄头文库上搜索。

1、气象观测站的调整,某地区内有12个气象观测站,位置如下图。,十年来各站测得的年降水量如下表所示:,为了节省开支,想要适当减少气象观测站。问减少哪些观测站可以使所得到的降水量的信息量仍然足够大?,欲解决的问题是,欲达到的目的是站数较少,同时得到的信息量仍足够大。在站数与信息量之间,信息量是主要因素。,1、问题分析:,由于不同站之间年降水量的相关性不仅取决于地理位置的远近,而且取决于地理气象环境的相似性。 而该问题的主要依据是降水量信息,而各站的地理位置信息仅作为参考信息。,问题分解成以下几个问题: 1)删除哪几个站? 2)如何预测被删除站的降水量信息? 3)如何度量上述预测值中所包含的降水量信

2、息是否足够大?,假设:,1)降水量信息反映了各观测站地理气象环境之间的相似性; 2)各站每年的降水量视为一个围绕其均值上下波动的正态随机变量;,模型建立与求解:,首先考虑相关系数矩阵。(xgxs.m),A=; R=corrcoef(A),具体计算,R = x1 x2 x3 x4 x5 x6 x7 1 1.0000 -0.2456 -0.2206 -0.1082 -0.3312 0.3481 -0.2622 2 -0.2456 1.0000 0.0777 -0.3965 0.1085 0.0103 0.1775 3 -0.2206 0.0777 1.0000 -0.5031 -0.2676 0.

3、4077 0.8126 4 -0.1082 -0.3965 -0.5031 1.0000 0.3158 -0.5567 -0.1523 5 -0.3312 0.1085 -0.2676 0.3158 1.0000 -0.6136 -0.0977 6 0.3481 0.0103 0.4077 -0.5567 -0.6136 1.0000 0.2236 7 -0.2622 0.1775 0.8126 -0.1523 -0.0977 0.2236 1.0000 8 0.0836 -0.1697 -0.0858 0.1384 -0.3156 0.0417 -0.3241 9 0.2928 0.1943

4、 0.1915 -0.2029 -0.2524 0.4918 0.0531 10 -0.3098 0.2421 -0.0175 -0.2501 0.5817 -0.0106 -0.0674 11 0.1587 0.0563 0.3278 -0.4201 0.0844 0.6544 0.0635 12 0.2786 -0.3460 0.0111 -0.2597 -0.2037 0.3631 -0.5152,续上表,x8 x9 x10 x11 x12 1 0.0836 0.2928 -0.3098 0.1587 0.2786 2 -0.1697 0.1943 0.2421 0.0563 -0.34

5、60 3 -0.0858 0.1915 -0.0175 0.3278 0.0111 4 0.1384 -0.2029 -0.2501 -0.4201 -0.2597 5 -0.3156 -0.2524 0.5817 0.0844 -0.2037 6 0.0417 0.4918 -0.0106 0.6544 0.3631 7 -0.3241 0.0531 -0.0674 0.0635 -0.5152 8 1.0000 0.6348 -0.5946 -0.0762 0.5392 9 0.6348 1.0000 -0.4225 0.4272 0.4259 10 -0.5946 -0.4225 1.0

6、000 0.4969 0.0026 11 -0.0762 0.4272 0.4969 1.0000 0.5652 12 0.5392 0.4259 0.0026 0.5652 1.0000,强相关变量:x3, x7 (0.750.81) 中度相关变量:当0.5|ij|0.7时,称xi, xj中度相关。 中度相关的变量有:x4, x6, x8, x9, x10, x11,x12 轻度相关变量:x1, x2, x5 显然,强相关变量与中度相关变量应优先考虑被删除。,总结,其次考虑标准差。将各站降水量的标准差列表:,对于标准差较大的站,认为它们包含的信息量比较大。所以应优先考虑删除标准差较小的观测站

7、。因此,考虑删除的站有: D= x4, x6, x7, x8, x10, x11, x12,b=std(A),排序:4 7 1 5 3 6 2,用线性回归方法根据保留站观测数据去预测被删除站的观测值。估计应该在集合D中删除35个变量。其组合数有,对每一种组合用回归方法进行线性拟合,根据剩余方差最小,每一个回归自变量显著为标准选出最佳组合。假定欲删除4个变量。,思考:究竟考虑删除几个观测站呢?,1)考虑删除观测站x4, x7, x10,x12进行回归拟合: x4=f1(x1,x2,x3,x5,x6,x8,x9, x11) x7=f2(x1,x2,x3,x5,x6,x8,x9, x11) x10=

8、f3(x1,x2,x3,x5,x6,x8,x9, x11) x12=f4(x1,x2,x3,x5,x6,x8,x9, x11) 其结果见huig2.m,例,2)考虑删除观测站x6, x7, x8,x10进行回归拟合: x6=f1(x1,x2,x3,x4,x5,x9,x11, x12) x7=f2(x1,x2,x3,x4,x5,x9,x11, x12) x8=f3(x1,x2,x3,x4,x5,x9,x11, x12) x10=f4(x1,x2,x3,x4,x5,x9,x11, x12) 其结果见huig1.m,b1,bint1,r1,rint1,stats1=regress(Y1,X);,两种

9、情况对比:,当确定删除变量x6,x7,x8,x10的方案后,还可以通过逐步回归方法确定最佳回归方程。 stepwise(X, y, inmodel,alfha)(huig11.m),例如输入: X=x1,x2,x3,x4; stepwise(X,y,1,2,3) 注意:将得到一个交互式的界面,输出结果:,输出结果:,通过各种情况的比较,得到如下的结果:删除观测站x6,x7,x8, x10,得到四个相对应的回归方程(如前面所示)。四个回归方程的剩余方差分别为:,结果分析:,定义信息损失比率:,计算出删除6,7,8,10四站的信息损失比率分别为: dert = 4.02% 0.22% 25.96%

10、 8.85% 平均信息损失为: 9.76% 删除4个站的降水量信息仍保留了约90%,结果比较令人满意。,除了以上分析方法以外是否还有其它统计方法可以分析呢? 如主成分分析法、定义信息熵函数等。,思考:,熵(Entropy)是分子热力学中的一个概念,用以描述分子随机运动的无序程度。分子运动越是无序,则熵越大。 在信息论中,此概念被用以衡量随机试验得到的信息量的大小。熵越大,信息量越大。,最大熵原理,定义,其中c是常数,pi=PX=xi, i =1,2,n, 一般取 c=1. 不加任何限制,当pi=1/n时,熵最大。,定义,假设X是连续型随机变量,X的密度函数是p(x),则 熵函数定义为:,在方差一定的连续型概率分布中,以正态分布的 熵最大; ;,性质,例,将系统状态限制在有限区间之内时,使熵最大的分布是该区间上的均匀分布。,对气象观测站问题,可以计算在各观测站下的 标准差i的值,定义pi= i/ j, 或,可以计算当删除某个观测站,信息熵的变化值。即,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号