应用回归分析liu改

上传人:zw****58 文档编号:57233451 上传时间:2018-10-20 格式:PPT 页数:35 大小:763KB
返回 下载 相关 举报
应用回归分析liu改_第1页
第1页 / 共35页
应用回归分析liu改_第2页
第2页 / 共35页
应用回归分析liu改_第3页
第3页 / 共35页
应用回归分析liu改_第4页
第4页 / 共35页
应用回归分析liu改_第5页
第5页 / 共35页
点击查看更多>>
资源描述

《应用回归分析liu改》由会员分享,可在线阅读,更多相关《应用回归分析liu改(35页珍藏版)》请在金锄头文库上搜索。

1、第八章,应用回归分析,回归分析的研究对象,家庭收入与家庭支出的关系 父母身高与子/女身高的关系 平时作业成绩与最后的考试成绩的关系 银行利率与股票指数的关系,现实世界中变量之间的关系并不总是可以用函数关系(自变量确定,因变量唯一)来表示的 比如:,经验和统计数据表明某些变量的取值相互之间是有 关系的,不是完全无关的,这种关系称为统计相关关系,统计相关关系:,回归分析及回归方程:,回归分析就是研究变量间的统计相关关系 一种统计方法.根据变元的统计数据,用一个函数来近似变 元间的统计相关关系,这个函数叫回归方程或 回归函数,本例中, 父亲身高与儿子身高的关系就是统计相关关系 上述高尔顿得到的近似直

2、线方程就是回归方程,8.1 一元线性回归,一元线性回归的模型:,其中,X为确定性变量,它是可以测量和控制的,也称解释变量或自变量; Y为被解释变量或响应变量,根据变元(X,Y)的一组观测值 代入上述一元线性回归模型,得:,我们导出了参数的极大似然估计,但是,历史上高尔顿是用我们高等数学中所学过的最小二乘法导出的,因此,一般称之为最小二乘估计,重要公式,关于上述例1,请大家思考如下问题:,我们得到的回归方程有什么用?根据哪些指标可以判断回归的效果?上述回归的效果如何?上例中:年龄为自变量(控制变量),体重为因变量(响应变量),回 归方程为: y = 7.83+2.01x , 那么据此方程得: x

3、 = (y -7.83)/2.01 ,它 可否视为把体重作为自变量,年龄作为因变量的回归方程?对于任意给定的一组数值(xi, yi) i=1,2,n,比如 xi 表示第i天的最高气温, yi表示第i天股市的收盘指数,是否都可以像例1一样代入参数的公式并求出回归方程?如果观测值较多,直接手算比较复杂,如何借助计算机求解回归方程?,关于问题1:回归方程有什么用途?,回归方程的主要用途是预测和控制,比如根据上例的回归方程 y = 7.83+2.01x ,我们可以预测 x=2.2(岁)时儿童的体重为: y = 7.83+2.01*2.2=12.252(kg)-这是y的点估计,我们还可 以得到y的区间估

4、计。,对于一元线性回归模型 ,其中误差项满足正态性,独立性,及 方差齐性的条件 , 给定 ,则对应 的点估计为 ;当 n 充分 大时, 置信水平为,此外,我们还可以求出参数,关于问题2:哪些指标可以判断回归的效果?,如下指标都可以直接或间接用来表示回归的效果:残差平方和 SSE估计标准差 相关系数 R判定系数 修正判定系数 其中p为自变元个数从例1第二问的结果看,该例回归的效果还是很好的,关于问题3: 能否由体重关于年龄的回归方程: y = 7.83+2.01x , 得出年龄关于体重的回归方程: x = (y -7.83)/2.01=0.4975y 3.8955 ?,不可以。事实上,如果把体重

5、作为自变量年龄作为因变量,代 入一元回归的公式,得:x = 0.4939y 3.853; 二者为何不同呢? 因为我们这里介绍的一元回归模型中,自变量与响应变量的地位 是不等同的还有一种回归,叫距离回归,即通过各散点到回归函数的距离平方和最小来求出回归参数,此时自变量与响应变量的地位是等同的,这种情况下是可以直接从 y关于 x 的回归方程解出 x 关于 y 的回归方程的,关于问题4: 对于任意给定的一组数值(xi, yi) i=1,2,n,是否都可以求变量的回归方程?,可以代入参数最小二乘估计的公式求出变元的回归方程,但 是,如果变元 X 和 Y 没有统计相关关系,这样求出的回归 方程是没有意义

6、的(如气温与股票点数);而如果回归模型 的三个条件,即正态性,独立性,方差齐性 不满足,我们就 无法对参数的概率特性(分布,区间估计 等)作出判断。,直观地说,如果根据变元 X 和 Y 的观测值算出的相关系数的绝对值越大(越接近1),即表示变元 X 和 Y 线性关系越强,这时拟合观测值(xi, yi)的回归方程越有 意义那么,相关系数的绝对值要达到多大才可以求回归方程呢?在统计上,我们是用假设检验的方法来判定变元的线性关系是否显著,因为检验的 统计量服从F分布(证明略),因此这个检验叫F检验,关于问题4: 如何借助计算机算法进行回归分析?,各种统计软件都有回归分析的功能,比如SAS,SPSS,

7、R,包 括MATLAB的统计包 等,这里我们介绍EXCEL的回归分析功能,操作步骤(多元回归同样操作,但利用EXCEL多元回归分析时自变元个数不能超过16个): 1)把数据输入EXCEL表 2)点工具菜单 加载宏 数据分析 回归,对例1中数据的EXCEL回归分析结果:,相关系数,判定系数,修正判定系数,估计标准差,F统计量观测值,F检验的P值,当P值小于给定显著性水平时,说明变元线性关系显著,P值小于显著性水平时说明常数项显著性非零,P值小于显著性水平时说明x系数显著性非零,回归参数置信区间的上下限,SSR,SSE,SST,F=(SSR/1)/(SSE/n-2) F(1,n-2),例2:恩格尔系数(食品支出与收入之比)的估算,已知人均月收入X与人均食品月支出Y的15组抽样数 据如下,求恩格尔系数:,分析:根据给定数据,先找出X,Y的回归函数,再根据回归函数来估计恩 格尔系数,解:利用EXCEL进行回归分析,得:,8.2 多元线性回归,令:,解方程组得参数的,此外:,例3:试根据表中居民月收入X1(单位百元)及 某商品的单价X2(单位十元)来拟合该商 品的需求量Y(单位百件)的函数,解:利用EXCEL进行回归分析,得:,需要说明的是:,逐步回归,多元回归参数的检验,预测,参差分析,及应用案例等 略THE ENDTHANKS,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号