气象统计方法 第一章 气象资料及其表示方法ppt课件

上传人:bin****86 文档编号:55414302 上传时间:2018-09-29 格式:PPT 页数:125 大小:3.77MB
返回 下载 相关 举报
气象统计方法 第一章 气象资料及其表示方法ppt课件_第1页
第1页 / 共125页
气象统计方法 第一章 气象资料及其表示方法ppt课件_第2页
第2页 / 共125页
气象统计方法 第一章 气象资料及其表示方法ppt课件_第3页
第3页 / 共125页
气象统计方法 第一章 气象资料及其表示方法ppt课件_第4页
第4页 / 共125页
气象统计方法 第一章 气象资料及其表示方法ppt课件_第5页
第5页 / 共125页
点击查看更多>>
资源描述

《气象统计方法 第一章 气象资料及其表示方法ppt课件》由会员分享,可在线阅读,更多相关《气象统计方法 第一章 气象资料及其表示方法ppt课件(125页珍藏版)》请在金锄头文库上搜索。

1、气象统计方法,主讲:温 娜,南京信息工程大学 大气科学学院 2015年3月,本课件主要参考南信大李丽平老师课件,要求: 1、掌握气象上常用的一些统计方法,运用这些方法进行资料分析,在此基础上作一些简单的气候预测等 2、了解其它方法在业务和科研中的应用,对后期学习起引导作用,气象统计方法:利用统计方法对气象资料样本进行分析来估计和推测总体的规律性,为气象预报提供依据。,课时安排 总学时:48学时(1-16周) 讲授为主, 课堂练习 考核方式 平时成绩(出勤、课堂作业) 期末考试,参考书目: 1、李湘阁等气象统计方法, 2、黄嘉佑著气象统计分析与预报方法,气象出版社,2004.3 3、施能著气象统

2、计预报,气象出版社,2009.11 4、吴洪宝等著气候变率诊断和预测方法,气象出版社,2010.6 5、魏凤英著现代气候统计诊断与预测技术,气象出版社,2009.9,教学内容,第一章 气象资料及其表示方法 第二章 气候稳定性检验 第三章 选择最大信息的预报因子 第四章 一元线性回归分析 第五章 多元线性回归分析 第六章 气候趋势分析 第七章 主分量分析 第八章 聚类分析,第一章 气象资料及其表示方法,ARGO计划,气象监测意义:,记录天气、气候的实际情况 了解气候的基本状况 分析研究气候变化规律 气候预测 (第一张天气图的诞生),拉萨站(29N, 91E)气温观测数据,江苏省(116-122E

3、,30-36N)月平均气温数据(1958-2007),江苏省(116-122E,30-36N)月平均气温数据(1958-2007),气象中单个或多个要素可看成为统计学中单个或多个变量。,二、气象资料的表示,第一节 单个要素的气象资料,1、数据的表示:某要素x有n 次观测值,其向量表达形式为或者n 样本容量,时间序列概念数据是随时间变化的序列,习惯称为时间序列。例如:取某要素月平均值的n年资料几何意义:(1)n 维空间中的一个点(2)一维空间(单坐标)中的n个点,举例:1.某站点1958至2007年的气温2.某站点1960至2010年一月份的气温3.某站点某时段冬季/夏季降水,2、数据资料的统计

4、特征,要素样本中资料分布的特点-用一些统计量表征。 1)平均值含义:平均值是要素总体数学期望的一个估计。反映了该要素的平均(气候)状况。,平均值概念在气象上的应用:气象上的月平均气温、年平均气温及某要素多年平均值就是这种统计量。 例如:某地气候状态 (对于逐月资料,一般分别求各月多年的平均值,所以会有12个月平均值场;逐日资料也是类似)。气象研究中,不同时间分辨率气象资料的使用(逐日资料、月资料、年资料等),举例:江苏气候?,江苏省1958-2007年月平均气温,江苏省各月气温平均值(气候态),江苏省1958-2007年冬季月平均气温,2)距平含义:反映数据偏离平均值的状况 ,也是通常所说的异

5、常。 距平序列:单要素样本中每个样本资料点的距平值组成的序列称为距平序列,也可以记为距平向量。,气象上的应用: 中心化的概念:把资料处理为距平的方法叫中心化。气象上常用距平值代替原样本中的资料值作为研究对象。中心化的必要性:因为气象要素的年变化周期影响很大,各月的平均值不一样,为了使之能在同一水平下比较,常使用距平值(比如之前的举例)。特性:距平值的平均值为0,使用方便;直接作为预报值,比较直观(偏高/偏 低)。,举例:某地气温的变化情况?(气温偏高、偏低是相对于它的平均值而言),江苏省冬季气温的异常(1958-2007),如何正确计算异常场?,不可取,江苏省气温异常(1958-2007),3

6、)方差和均方差(标准差)对气象要素x,资料长度n,其表达式:含义: 是均方差(标准差),描述样本中资料与平均值差异的平均状况,反映变量围绕平均值的平均变化程度(离散程度), 是方差。,方 差,向量表示形式:,气象上的应用:1)如果12月份气温标准差比1月份大,反映了12月份气温随时间变化幅度比1月大。2)对于同一个月(例如12月),如果南京气温的标准差比拉萨小,表明拉萨冬季气温的变化幅度比较大。(内陆日变化较沿海大,这个日变化大小的比较使用的是标准差的比较),江苏省各月气温标准差,3)均方差小的要素预报比大的困难还是容易?原因?4)变量减去某常数后均方差相同。5)标准差与变量值同量纲,一般用标

7、准差表示变量取值变化的大小。,数据的标准化,对气象要素x,资料长度n,其表达式:特征:1)标准化变量的平均值为0。2)标准化变量的方差为1。,为何要进行标准化?各要素单位不同、平均值和标准差也不同。为使它们在同一水平上比较,采用标准化方法,使它们变成同一水平的无单位的变量-标准化变量。,江苏省气温异常及其标准化,降水距平百分率,距平/平均值*100% 1)计算降水距平,即观测值减去平均值 2)1步骤所得结果除以该平均值,乘以100 ,即为降水距平百分比 注意:当观测值序列时间比较长,超过30年,可以选择19802009的平均值,作为步骤1中的平均值,4) 变率和变差系数,1)意义:说明变量值变

8、化的大小。 2)变率绝对变率:距平绝对值的平均。相对变率: 绝对变率与平均值之比,3)变差系数标准差与平均值之比(%)表示变量的相对变化,,注意:绝对变率和标准差的数量级与变量平均值的量级有关。有些同类型变量,彼此之间平均值差别大,若要比较它们的变化性用绝对变率和标准差不恰当,应当利用相对变率或变差系数。,5)频率分布累积频率概念的引入: 平均值和均方差相同,但取值很大区别,区别其特征,就需要引入新的统计量-累积频率。,累积频率:变量小于某上限的次数与总次数之比。(样本特征直方图),总体(母体):统计分析对象的全体。 样本:总体中的一部分。,三、总体和样本,理解与应用: 总体的特征是客观存在的

9、 样本的特征随样本而变,与其有关 的变量均称为随机变量,如平 均值、均方差等 选取有代表性的样本很重要 样本量n=30,根据数理统计中的大数定理推断得到。 气象上的总体指无限总体,一组气象资料就是无限总体的样本。总体与样本关系的相对性。,大数定律,大数定律又称大数法则、大数率。 在一个随机事件中,随着试验次数的增加,事件发生的频率趋于一个稳定值;同时,在对物理量的测量实践中,大量测定值的算术平均也具有稳定性。在数理统计中,根据贝努利定理辛钦定理:当n很大时,算术平均值接近数学期望;频率以概率收敛于事件的概率。,1)分布函数无限总体的累积频率称为概率密度函数,其最常见的形式是正态分布和 分别是总

10、体平均值(期望)和标准差,可以用样本平均值和均方差去估计。,,,正态分布曲线,标准化变量的平均值为0、方差为1。 特点:1)标准化正态分布随机变量的绝对值大于2.58(1.96)的概率仅为0.01(0.05)2)不同要素变量作图3)标准化变量值的取值范围(+/-3之间),大于3的概率仅为0.0027世界气象组织(WMO)旱涝年确定标准:距平达到或者大于2倍均方差,出现概率不到5%年份。,江苏省月平均气温标准化数据,P(|T|=2)=0.0483; P(|T|=3)=0.005,江苏省冬季气温数据分布图,2)正态分布的统计检验,大多数气候诊断方法和预测模型是在气候变量呈正态分布假定前提下进行的,

11、所以对气候变量是否呈正态分布形态的检验是十分必要的。正态分布检验不仅可以判断原始变量是否遵从正态分布,还可以检验那些原本不遵从正态分布,但经过数学变换后的变量是否已成为正态分布形式。,(1)概念峰度系数与偏度系数是用来衡量随机变量概率密度分布曲线形状的数字特征,描述了气候变量的分布特征。偏度系数:表征曲线峰点对期望值(平均值)偏离的程度。峰度系数:表征曲线分布形态顶峰的凸平度(即渐进于横轴的陡度)。,(2)标准偏度系数和峰度系数的计算公式为:其中, 和 s 分别为样本均值和标准差。,g2=,g1=,偏度系数:,峰度系数:,标准偏度系数的意义,测量数据分布的不对称性情况, 刻画以平均值为中心的偏

12、向情况, g10,表示正偏,即均值在峰值的右边; g1=0,表示对称分布,标准峰度系数的意义,测量分布图像坡度的缓急程度 g20, 表明图形坡度偏陡,若g1=0, g2=0时,表明研究变量为理想的正态分布变量,(3)显著性检验,(4)资料的正态化1、正态化的必要性 各类统计预报模型和统计检验方法(Ftu 检验)要求资料是符合正态分布。年月平均气温气压多雨地区的月降水量符合!日降水和少雨地区月降水通常偏态。旬候降水不一定!,2、资料正态化处理方法1.立方根或四次方根;2.双曲正切转换(纠正课本公式)-旬降水;3.化为有序数后的正态化转换(标准化和正态化)。,江苏省全年月降水数据分布图,*也可以理

13、解为同一要素多个格点(站点)的资料,下面慢慢体会。,第二节 多要素的气象资料,一、数据矩阵,多个气象要素的样本如何表示?-矩阵。 设有m个气象要素,每个要素有n次观测值,则数据矩阵为:,(2.1),第t个样本的资料向量为,(2.2),两个方面来研究问题() “R型分析”:研究不同要素或变量(如同一 要素不同格点之间)的关系。(列) “Q型分析”:研究样本之间的关系(行)。,二、数据的两种空间表示(几何意义),1、n维空间中的 m个点(列)m个变量(格点、站点)确定了n维空间中的 m个点;用来研究变量(或者不同格点、站点)之间的关系。-相关关系,如两个变量之间的相关系数 2、m维空间中的n个点(

14、行)-空间点聚图一个样本对应m维空间中的一个点;分析样本之间的关系时用到,如寻找相似个例。,三、均值向量m个变量的样本平均值组成的向量。m维空间中的n个点的重心(各部分受到的重力作用集中于一点,这一点就是重心 )。,(2.3),多年平均1月气温(19712010年),多年平均7月气温(19712010年),多年平均1月降水量(19712010年),多年平均7月降水量(19712010年),四、距平向量,其表达式为:,五、协方差和协方差矩阵,1.协方差衡量任意两个气象要素(变量)之间关系的统计量(正、负相关关系),另外一个统计量叫相关系数(以后讲解)。,表达式:,(2.4),距平的内积,协方差气

15、象意义的进一步理解:1)反映了两个气象要素异常关系的平均状况,或者两个变量的正、负相关关系。两变量关系越密切,其协方差的绝对值越大,如理解(气温为例):前冬气温负距平(冷)、后冬正距平(暖)-协方差负值-反相关前冬气温正距平(暖)、后冬正距平(暖)-协方差正值-正相关2)变量自身的协方差就是方差。,距平的乘积,X1与x2的距平符号相同率高,有相同的变化趋势, x2与x3的距平符号相反率高,有相反的变化趋势; 两组变量均有良好的相关关系。问题:协方差带单位,不同要素之间不好比较,以后学习相关系数可解决这个问题。,2.协方差矩阵m阶对称矩阵,对角线元素是第i个变量的方差,撇号代表距平。,(2.6)

16、,协方差的另一种表示:用离差积表示,构成离差矩阵。总体协方差矩阵的无偏估计,(2.7),(2.8),1月气温标准差,7月气温标准差,1月降水标准差,7月降水标准差,状态资料和统计特征,1、状态资料表征气象要素的各种状态,观测结果无法用数据表示。如雾、冰雹、霜-用“有”、“无”、“强”、“弱”等表示。雨的强度-等级表示,如大暴雨、大雨等。风的强度等级-1级、2、。12,2、频率表、分布列如何描述状态资料的统计特征?列出各个状态出现的频率。对样本而言是频率表,总体而言就是分布列。,3、多维频率表、多维分布列,针对气象要素的状态资料;概念:统计多个气象要素(现象)的各种情况 下的频率,组成一张多维频率表。 优点:对预报有参考价值。,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > 其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号