气象统计方法第五章多元线性回归分析.

上传人:我** 文档编号:117859550 上传时间:2019-12-11 格式:PPT 页数:60 大小:1.12MB
返回 下载 相关 举报
气象统计方法第五章多元线性回归分析._第1页
第1页 / 共60页
气象统计方法第五章多元线性回归分析._第2页
第2页 / 共60页
气象统计方法第五章多元线性回归分析._第3页
第3页 / 共60页
气象统计方法第五章多元线性回归分析._第4页
第4页 / 共60页
气象统计方法第五章多元线性回归分析._第5页
第5页 / 共60页
点击查看更多>>
资源描述

《气象统计方法第五章多元线性回归分析.》由会员分享,可在线阅读,更多相关《气象统计方法第五章多元线性回归分析.(60页珍藏版)》请在金锄头文库上搜索。

1、气象统计方法 主讲:温 娜 南京信息工程大学 大气科学学院 2014年9月 本课件主要参考南信大李丽平老师的课件 第五章第五章 多元线性回归(多元线性回归( huang36huang36) 本章主要内容本章主要内容 概述 回归模型 回归系数的最小二乘估计 方差分析 回归方程显著性检验 预报因子显著性检验 复相关系数 预报步骤 一、概述一、概述 1. 意义 在气象统计预报中,寻找与预报量线性 关系很好的单个因子是不够的,实际上某个 气象要素的变化可能和前期多个因子有关, 因此大部分气象统计预报中的回归分析都是 用多元回归技术进行。 2.基本概念 多元回归就是研究一个预报量和多个 预报因子之间的关

2、系。主要讨论较为简 单的多元线性回归。其分析原理与一元 线性回归分析完全相同。 二、回归模型 假定预报量y与p个预报因子关系是线 性,为研究它们之间的联系作n次抽样,则 可得到如下结构表达式: (1) 其中, 为p+1个待估计参数, 是p个 一般变量, 是随机误差(相互独立变 量),服从 正态分布。上述模型 还可以写为: (2) 其中, 都是向量。X是因子矩阵,即 我们得到的是一组实测p个变量的样本,利 用这组样本(n 次抽样)对上述回归模型进行 估计,得到的估计方程为多元线性回归估计方 程,记为: (3) 其中, 是 的估计值,下面讨论如何确定 它们。 三、回归系数最小二乘估计三、回归系数最

3、小二乘估计 和一元线性回归类似,在样本容量为n的y 预报量和因子变量x的实测值中,满足线性回 归方程 的要求的回归系数,应是使全部的预报量观测值与回 归估计值的差值平方和达到最小。即满足 最小。 基本条件基本条件 对一组样本资料,预报值的估计可以看成 为一个向量,记为 满足(3)的回归方程,也可以写为矩阵形式, 即 ,其中,X就是因子矩阵,b为回 归系数,即 回归回归估计估计方程组方程组的矩阵形式的矩阵形式 预报量的观测值与回归值之差的内积就 是它们的分量的差值平方和,即 根据微分学原理,有 可以写成向量的形式 =0 补充用矢量和 矩阵形式表示的函数的微分 补充补充 矩阵和向量形式表示的矩阵和

4、向量形式表示的 函数的微分函数的微分 设x 为 列向量,a为 列向 量, 为 的函数,则f 对x的偏微分记为 1)如果x、a及f如上面定义,则有 2)如果x如上面定义,令 , 则 第第2/32/3项,项, x-bx-b X X y-ay-a 3)如果A为 对称阵,则 对x的偏微分为 第四项第四项 特别注意特别注意 当矩阵和向量的运算结果是一行一列的矩 阵时,可以表示一个多元函数; 多元函数的值域是一个数量,当它表达(x1, x2 ,xm) 有规则运算时,用向量和矩阵运算比较 方便。 当多元函数f(x1, x2 ,xm)表示(x1, x2 ,xm) 有规则运算时,它对( x1, x2 ,xm )

5、的偏导也 是有规则的,可用多元函数f(X)对向量X的导数 一并表示。 前面的式子是采用向量和矩阵的运 算表示多元函数及多元函数对自变量的 导数,不能说成“矩阵和向量的求导”, 因为只有函数才能对它的自变量求导数 。 通过分析其向量形式可得到求回归系数 的标准方程组矩阵形式,即 (4) 展开为 求解上述方程组的方法: 1)用高斯或亚当高斯消去法,解此 正规方程组得回归系数估计值b0和 bk(k=1-p) 2)用矩阵运算求解(逆矩阵法) 如如A A有逆有逆( (即即|A|0),|A|0),则则b b的解为的解为: : b=Ab=A-1 -1B=(XX) B=(XX)-1 -1XY XY l Ab=

6、B A-1Ab=A-1B b=A-1B l b=A-1B=(XX)-1XY 四、线性回归模型的其他两种形式 1、距平形式: 从(4)式可以导出 代入(3)式,得到 令 上式变为 (5) . 对一组样本容量为n的多个距平变量数据, 可类似写成回归方程的矩阵形式 其中, 气象上,为消除季节变化的差别或者 地点的差别,经常使用距平变量研究问题 。所以形如(5)式的回归方程更为常用。 1)从距平变量的观测值求回归系数, 同样用最小二乘法导出求回归系数的标准 方程组,其矩阵形式为 (6) 展开得到求系数标准方程组形式为 2)有时,为书写方便,(6)式两边乘上 1/n,变成各变量的协方差形式,相应的方 程

7、组写为 其中, 通常称 为因子协方差矩阵。 于是(6)式可以写为 。 其中 上面的方程组和(6)式没有本质区别,有时 直接从(6)式求解,但写成上面的形式。 2、如果把变量变成标准化变量,即对(5) 式的距平变量多元线性回归方程两边除以 预报量y的标准差,得到 其中, 为p个变量的标准差。 若令 则可以化为标准化回归方程 对一组样本容量为n的多变量数据,可 类似写成标准化变量回归方程矩阵形式 (7) 其中, 为标准化因子矩阵, 为标 准化回归系数向量,其中第k个分量为 。 可用最小二乘法求出标准化回归系数向 量,标准化方程组的矩阵形式为 或者 (8) 其中, R为p个因子的相关矩阵。(8)式展

8、开为 回归方程几种形式概括回归方程几种形式概括 l原始变量回归方程: l距平变量回归方程: l标准化变量回归方程: 四、回归问题的方差分析 和一元回归问题方差分析类似,预报量 的方差可以表示成回归估计值的方差(回 归 方差)和误差方差(残差方差)之和。 有时候,两边同时乘以n变成各变量离差 平方和的关系。 上式最后一项为0。U和Q分别称为回归平 方和及残差平方和, 称为总离差平方和。U 反映了p个因子与预报量线性关系部分。Q反 映了观测值偏离回归直线的程度。 向量形式: 五五 复相关系数复相关系数 意义: 上式反映了回归平方和、总离差 平方和与复相关系数的关系。可见 ,复相关系数实际是衡量p个

9、因子对 预报量的线性解释方差的百分率, 其变化在01之间。 1)衡量一个预报量和多个预报因子 之间的线性关系程度的量; 2)衡量了预报因子对预报量的线性解 释方差的百分率; 3)R的绝对值越大,表明回归效果越好 。 调整复相关系数 残差方差的无偏估计量: 预报量y的方差的无偏估计量: 调整复相关系数是对总体复相关系数的估计, 也是对总体回归关系的解释方差的一种估计。 六、回归方程的显著性检验六、回归方程的显著性检验 假设预报因子与预报量之间无线性关系 ,则回归系数应该为0。 检验假设: 计算统计量 遵从分子自由度为p,分母自由度为n-p-1的F 分布,在显著性水平 下,若 , 认为回归方程是显

10、著的。 七、预报值的95%置信区间 八、利用回归方程进行预报的步骤八、利用回归方程进行预报的步骤 1.确定预报量并选择恰当的因子。 2.根据数据计算回归系数标准方程组所包含 的有关统计量(因子的交叉积、矩阵协方 差阵或相关矩阵,以及因子与预报量交叉 积向量等); 3.求解线性方程组,定出回归系数; 4.建立回归方程并进行统计显著性检验; 5.利用已经给出的因子带入回归方程做出预 报量的估计,求出预报值的置信区间。 例1,为预报长江中下游7月降水,选取x1为当年长江 中下游五站平均的1月份降水量;x2是当年2月份平均 气温,n=29,由资料计算得离差阵 : 及 试建立二元回归方程 解:增广系数矩阵 1)、k=1 2) k=2 回归方程为 回归方程的显著性检验 总离差平方和 回归平方和 复相关系数 检验统计量 拒绝原假设,回归方程显著的 预报量与预报因子之间的关系常可能由于 某些条件的变化而发生变化; 如季节变化,位置变化等; 通常应依据不同的时间或位置而分别拟合 ; 如分别对夏季和冬季拟合; 分别对ENSO年以及非ENSO年进行拟合。 回归分析需注意的事项回归分析需注意的事项 高斯-约当消去法(见huang附录B) 作业作业

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号