气象统计方法第四章一元线性回归分析

上传人:今*** 文档编号:111363904 上传时间:2019-11-02 格式:PPT 页数:47 大小:924.50KB
返回 下载 相关 举报
气象统计方法第四章一元线性回归分析_第1页
第1页 / 共47页
气象统计方法第四章一元线性回归分析_第2页
第2页 / 共47页
气象统计方法第四章一元线性回归分析_第3页
第3页 / 共47页
气象统计方法第四章一元线性回归分析_第4页
第4页 / 共47页
气象统计方法第四章一元线性回归分析_第5页
第5页 / 共47页
点击查看更多>>
资源描述

《气象统计方法第四章一元线性回归分析》由会员分享,可在线阅读,更多相关《气象统计方法第四章一元线性回归分析(47页珍藏版)》请在金锄头文库上搜索。

1、气象统计方法,主讲:温 娜,南京信息工程大学 大气科学学院 2014年9月,本课件主要参考南信大李丽平老师的课件,第四章 一元线性回归(huang28),主要内容,概述 基本概念 原理 方差分析 相关系数和线性回归 回归方程的显著性检验,1.概述 回归分析是用来寻找若干变量之间的统计联系一种方法,利用找到的统计关系对某一变量作出未来时刻的估计,称为预报值。包括线性回归和非线性回归,常用的线性回归。,如:为了预报某地某月平均气温(预报量)未来时刻的变化,选择预报前期已发生的多个有关的气象要素(预报因子),利用回归分析方法分析多个预报因子和预报变量之间的相互关系,建立统计关系方程式,最后利用其对未

2、来时刻的气温作出预报估计。,回归模型的类型,2.基本概念 一元回归处理的是两个变量之间的关系,即一个预报量和一个预报因子之间的关系。,3.原理 一般来说,对样本量为n的预报量y与预报因子x的一组样本,如果认为y与x是一种线性统计关系,预报量的估计量与x有如下关系: (1) 或者写为一般的回归方程,a是截距,b是斜率。 对所有的 ,若 与 的偏差最小,就认为(1)所确定的直线能最好地代表所有实测点的散布规律。 为了消除偏差符号的影响,可以用偏差的平方来反映偏差的绝对值偏离情况。,全部观测值与回归估计值的离差平方和记为 它刻画了全部观测值与回归直线偏离程度。 显然,Q值越小越好。a和b是待定系数,

3、根据 微积分学中的极值原理,要求:,满足上面关系的Q值最小。整理得到: 上式称为求回归系数的标准方程组。展 开:,回归系数也可直接表示为:,上述求回归系数的方法称为最小二乘法,距平形式的回归方程: 即当变量为距平时,回归方程可以不用求a,因为a=0,回归直线通过原点。 标准化距平形式的回归方程:,4.回归问题的方差分析 (1)意义 评价回归方程的优劣。 (2)预报量的方差可以表示成回归估计值 的方差(回归方差)和误差方差(残 差方差)之和。,即: 方差分析表明,预报量y的变化可以看成由前期 因子x的变化所引起的,同时加上随机因素e变化的 影响,这种前期因子x的变化影响可以归为一种简 单的线性关

4、系,这部分关系的变化可以用回归方差 的大小来衡量。如果回归方差大,表明用线性关系 解释y与x的关系比较符合实际情况,回归模型比较 好。,误差方差,回归方差,预报量方差,有时候,两边同时乘以n变成各变量离差平方和的关 系。 U和Q分别称为回归平方和及残差平方和, 称为总 离差平方和。,1.总离差平方和( ) 反映因变量的 n 个观察值与其均值的总离差。 2.回归平方和(U) 反映自变量 x 的变化对因变量 y 取值变化的影响,或者说,是由于 x 与 y 之间的线性关系引起的 y 的取值变化,也称为可解释的平方和。 3.残差平方和(Q) 反映除 x 以外的其它因素对 y 取值的影响,也称为不可解释

5、的平方和或剩余平方和。,5. 相关系数与线性回归- (1)因为回归方差不可能大于预报量的方差,可以用它们的比值来衡量方程的拟合效果。即:,b代入上式得:,上式含义: 表明了预报因子x对预报量y方差的线性关系程度,这一比值又称为解释方差(方差贡献率)。 也可以说明相关系数的含义:它是衡量两个变量线性关系密切程度的量,又被称为回归方程的判决系数。,判决系数R2 (coefficient of determination),1. 回归平方和占总离差平方和的比例;,反映回归直线的拟合程度; 取值范围在 0 , 1 之间; R2 1,说明回归方程拟合的越好;R20,说明回归方程拟合的越差; 判决系数等于

6、相关系数的平方,即R2r2,(2)回归系数b与相关系数之间的关系 r与b同号。,6. 回归方程的显著性检验 原假设回归系数b为0的条件下,上述统计量遵从分子自由度为1,分母自由度为(n-2)的F分布,若线性相关显著,则回归方差较大,因此统计量F也较大;反之,F较小。对给定的显著性水平 , 查表得到F临界值 ,如果 ,则拒绝原假设,认为线性相关显著。,上式还可以表示为:,由于回归系数b已经知道,根据 计算出x和y的相关系数,然后可以求得F.,注意: 对于一元线性回归来说,因为F的相关系数表达式开方就是相关系数t检验的表达式,故回归方程的检验与相关系数的检验一致。,提出假设 H0:1=0, 线性关

7、系不显著 计算检验统计量F 确定显著性水平,并根据分子自由度1和分母自由度n-2找出临界值F 作出决策:若F F ,拒绝H0;若FF ,不能拒绝H0,线性关系检验的步骤概括如下:,7.回归系数的显著性检验,气象中经常使用回归方程的距平形式,对回归方程的显著性检验可以只对因子的回归系数进行检验。,遵从自由度为n-2的t分布;或者根据F分布与t分布的关系有:,上式与之前方差检验的公式完全一致,但 在检验单个变量在回归方程中的作用时更为常用。,8.预报的置信区间(95%置信区间) 因为 可以看成遵从 的分 布,所以其95%的置信区间为 。 是总体均方差(误差均方差)的无偏估计量。,例1:,1)计算回

8、归系数,确定方程,X变化一个单位,气温降低0.23度。,2)回归方程显著性检验:,3)计算预报值得置信区间,作出预测:,总离差平方和,x离差平方和,X和y离差积之和,一组计算公式,回归分析与相关分析的区别,1. 相关分析中,变量 x 变量 y 处于平等的地位;回归分析中,变量 y 称为因变量,处在被解释的地位,x 称为自变量,用于预测因变量的变化。 2. 相关分析中所涉及的变量 x 和 y 都是随机变量;回归分析中,因变量 y 是随机变量,自变量 x 可以是随机变量,也可以是非随机的确定变量。 3. 相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量 x 对变量 y 的影响大小,还可以由回归方程进行预测和控制。,利用冬季热带太平洋Nino3.4区平均海温异常指数,建立与江苏省夏季降水异常的一元线性回归预测模型。据观测2007年冬Nino3.4海温异常为 -1.2度,对江苏省夏季降水异常进行预测。,作业,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号