第5讲一元线性回归

上传人:工**** 文档编号:567246428 上传时间:2024-07-19 格式:PPT 页数:43 大小:567KB
返回 下载 相关 举报
第5讲一元线性回归_第1页
第1页 / 共43页
第5讲一元线性回归_第2页
第2页 / 共43页
第5讲一元线性回归_第3页
第3页 / 共43页
第5讲一元线性回归_第4页
第4页 / 共43页
第5讲一元线性回归_第5页
第5页 / 共43页
点击查看更多>>
资源描述

《第5讲一元线性回归》由会员分享,可在线阅读,更多相关《第5讲一元线性回归(43页珍藏版)》请在金锄头文库上搜索。

1、一、回归结果的显著性检验一、回归结果的显著性检验1.线性关系的检验检验自变量与因变量之间的线性关系是否显著检验自变量与因变量之间的线性关系是否显著将回归均方(MSR)同残差均方(MSE)加以比较,应用F 检验来分析二者之间的差别是否显著回归均方:回归平方和SSR除以相应的自由度(自变量的个数) 残差均方(MSE) :残差平方和SSE除以相应的自由度(n-2).1线性关系的检验的步骤线性关系的检验的步骤 1.提出假设nH0:1=0 线性关系不显著2. 计算计算检验统计量检验统计量F3.确定显著性水平,并根据分子自由度1和分母自由度n-2找出临界值F 4.作出决策:若FF ,拒绝H0;若FF ,拒

2、绝H0,线性关系显著3方差分析表方差分析表 Excel 输出的方差分析表输出的方差分析表42.回归系数的检验3.在在一一元元线线性性回回归归中中,等等价价于于线线性性关关系系的的显著性检验显著性检验1.检检验验 x 与与 y 之之间间是是否否具具有有线线性性关关系系,或或者者说说,检检验验自自变变量量 x 对对因因变变量量 y 的的影影响响是否显著是否显著2.理论基础是回归系数理论基础是回归系数 的抽样分布的抽样分布5样本统计量样本统计量 的分布的分布1.1. 是是是是根根根根据据据据最最最最小小小小二二二二乘乘乘乘法法法法求求求求出出出出的的的的样样样样本本本本统统统统计计计计量量量量,它它

3、它它有有有有自自自自己己己己的分布的分布的分布的分布2.2. 的的的的分布具有如下性质分布具有如下性质分布具有如下性质分布具有如下性质( ( ( (线性、无偏、最小方差线性、无偏、最小方差线性、无偏、最小方差线性、无偏、最小方差) ) ) ) 分布形式:正态分布分布形式:正态分布分布形式:正态分布分布形式:正态分布 数学期望:数学期望:数学期望:数学期望: 标准差:标准差:标准差:标准差: 由于由于由于由于 未知,需用其估计量未知,需用其估计量未知,需用其估计量未知,需用其估计量s s s sy y y y来来来来 代替得到代替得到代替得到代替得到 的估计的标准差的估计的标准差的估计的标准差的

4、估计的标准差6回归系数的检验检验步骤回归系数的检验检验步骤 1.提出假设nH0: 1 = 0 (没有线性关系) nH1: 1 0 (有线性关系) 2.计算检验的统计量3. 确定显著性水平确定显著性水平 ,并进行决策,并进行决策 t t t t,拒绝拒绝H H0 0; t t =7.533515t t=2.201=2.201,拒拒绝绝H H0 0,表表明明不不良良贷贷款款与贷款余额之间有线性关系与贷款余额之间有线性关系8回归系数的检验例题分析表回归系数的检验例题分析表P 值的应用值的应用P P=0.000000=0.000000 =0.05=0.05,拒绝原假设,拒绝原假设,不良贷款与贷不良贷款

5、与贷款余额之间有线性关系款余额之间有线性关系93、三种检验的关系、三种检验的关系在一元线性回归分析中,回归系数显著在一元线性回归分析中,回归系数显著性的性的t检验、回归方程显著性的检验、回归方程显著性的F检验,检验,相关系数显著性相关系数显著性 t检验,三者等价的,检验,三者等价的,检验结果是完全一致的。检验结果是完全一致的。对一元线性回归,只做其中对一元线性回归,只做其中 的一种检验即可。的一种检验即可。10二、二、 回归分析结果的评价回归分析结果的评价l建建立立的的模模型型是是否否合合适适?或或者者说说,这这个个拟拟合合的的模模型型有有多多“好好”?要回答这些问题,可以从以下几个方面入手?

6、要回答这些问题,可以从以下几个方面入手1.所所估估计计的的回回归归系系数数 的的符符号号是是否否与与理理论论或或事事先先预预期期相相一致一致n在在不不良良贷贷款款与与贷贷款款余余额额的的回回归归中中,可可以以预预期期贷贷款款余余额额越越多多不不良良贷贷款款也也可可能能会会越越多多,也也就就是是说说,回回归归系系数数的的值值应应该该是是正正 的的 , 在在 上上 面面 建建 立立 的的 回回 归归 方方 程程 中中 , 我我 们们 得得 到到 的的 回回 归归 系系 数数 为正值为正值2.如如果果理理论论上上认认为为x与与y之之间间的的关关系系不不仅仅是是正正的的,而而且且是是统计上显著的,那么

7、所建立的回归方程也应该如此统计上显著的,那么所建立的回归方程也应该如此n在在不不良良贷贷款款与与贷贷款款余余额额的的回回归归中中,二二者者之之间间为为正正的的线线性性关关系系,而而且且,对对回回归归系系数数的的t检检验验结结果果表表明明二二者者之之间间的的线线性性关关系是统计上显著的系是统计上显著的113.3.回回归归模模型型在在多多大大程程度度上上解解释释了了因因变变量量y y取取值值的的差差异?可以用判定系数异?可以用判定系数R R2 2来回答这一问题来回答这一问题n在在不不良良贷贷款款与与贷贷款款余余额额的的回回归归中中,得得到到的的R R2 2=71.16%=71.16%,解解释释了了

8、不不良良贷贷款款变变差差的的2/32/3以以上上,说明拟合的效果还算不错说明拟合的效果还算不错4.4.考考察察关关于于误误差差项项 的的正正态态性性假假定定是是否否成成立立。因因为为我我们们在在对对线线性性关关系系进进行行F F F F检检验验和和回回归归系系数数进进行行t t t t检检检检验验验验时时,都都要要求求误误差差项项 服服从从正正态态分分布布,否否则则,我我们们所所用用的的检检验验程程序序将将是是无无效效的的。 正正态态性性的的简简单单方法是画出残差的直方图或正态概率图方法是画出残差的直方图或正态概率图5.5.计量单位的讨论,因果模型的特征计量单位的讨论,因果模型的特征12Exc

9、el输出的部分回归结果输出的部分回归结果R2)13 小小 结结 w一、变量间关系的种类一、变量间关系的种类w二、相关系数的计算、评价及检验二、相关系数的计算、评价及检验w三、回归模型、回归方程、估计回归方程的概三、回归模型、回归方程、估计回归方程的概念,回归方程参数的最小二乘估计念,回归方程参数的最小二乘估计w四、判定系数、估计标准误差的四、判定系数、估计标准误差的w 计算,及线性关系检验及计算,及线性关系检验及w 回归系数的检验回归系数的检验w五、回归分析结果的评价五、回归分析结果的评价25利用回归方程进行估计和预测1.根据自变量 x 的取值估计或预测因变量 y的取值2.估计或预测的类型n点

10、估计wy 的平均值的点估计wy 的个别值的点估计n区间估计wy 的平均值的置信区间估计wy 的个别值的预测区间估计26利用回归方程进行估计和预测(点估计)2. 点估计值有n ny y 的平均值的点估计的平均值的点估计n ny y 的个别值的点估计的个别值的点估计3. 在点估计条件下,平均值的点估计和个别值的的点估计是一样的,但在区间估计中则不同1.对于自变量 x 的一个给定值x0 ,根据回归方程得到因变量 y 的一个估计值27 y 的平均值的点估计的平均值的点估计1.利用估计的回归方程,对于自变量 x 的一个给定值 x0 ,求出因变量 y 的平均值的一个估计值E(y0) ,就是平均值的点估计2

11、.在前面的例子中,假如我们要估计人均国民收入为2000元时,所有年份人均消费金额的的平均值,就是平均值的点估计。根据估计的回归方程得28 y 的个别值的点估计的个别值的点估计1.利用估计的回归方程,对于自变量 x 的一个给定值 x0 ,求出因变量 y 的一个个别值的估计值 ,就是个别值的点估计2. 比如,如果我们只是想知道1990年人均国民收入为1250.7元时的人均消费金额是多少,则属于个别值的点估计。根据估计的回归方程得291.点估计不能给出估计的精度,点估计值与实际值之间是有误差的,因此需要进行区间估计2.对于自变量 x 的一个给定值 x0,根据回归方程得到因变量 y 的一个估计区间3.

12、区间估计有两种类型n置信区间估计n预测区间估计30参数最小二乘估计量的协方差分析均是无偏估计均是正态分布协方差31 y 的平均值的置信区间估计的平均值的置信区间估计 1.利用估计的回归方程,对于自变量 x 的一个给定值 x0 ,求出因变量 y 的平均值E(y0)的估计区间 ,这一估计区间称为置信区间置信区间2. E(y0) 在1-置信水平下的置信区间为式式中中:S Sy y为为估估计标准误差计标准误差32【例】【例】根据前例,求出人均国民收入为1250.7元时,人均消费金额95%的置信区间w 解:根据前面的计算结果w 712.57,Sy=14.95,w t(13-2)2.201,n=13置信区

13、间为:712.57712.57 10.26510.265人人 均均 消消 费费 金金 额额 95%95%的的 置置 信信 区区 间间 为为 702.305702.305元元 722.835722.835元之间元之间33 y 的个别值的预测区间估计的个别值的预测区间估计 1.利用估计的回归方程,对于自变量 x 的一个给定值 x0 ,求出因变量 y 的一个个别值的估计区间,这一区间称为预测区间预测区间 2. y0在1-置信水平下的预测区间为注意!注意!34w 【例例】根据前例,求出1990年人均国民收入为1250.7元时,人均消费金额的95%的预测区间w 解:根据前面的计算结果有w 712.57,

14、Sy=14.95,t(13-2)2.201,n=13w 置信区间为712.57712.57 34.46934.469人人均均消消费费金金额额95%95%的的预预测测区区间间为为678.101678.101元元 747.039747.039元之间元之间35影响区间宽度的因素1. 置信水平 (1 - )n区间宽度随置信水平的增大而增大2. 数据的离散程度 (s)n区间宽度随离散程度的增大而增大3. 样本容量n区间宽度随样本容量的增大而减小4. 用于预测的 xp与x的差异程度n区间宽度随 xp与x 的差异程度的增大而增大36置信区间、预测区间、回归方程xp pyx x预测上限置信上限预测下限置信下限

15、37为你的难过而快乐的是敌人,为你的快乐而快乐的是朋友,为你的难过而难过的就是那些该放进心里的人。38抓住一个机会,你就放弃了更多的选择;放弃一个选择,你将会获得更多的机会。 -刘 伟39制度,让想犯错的人,犯不了错;文化,让有机会犯错的人,不愿意犯错。40作为一名教师没有什么讲授的内容是表达不清楚的。如果你讲授的内容让听众无法接受,要么是听众听不懂,要么是你自己就没有弄清楚。41如果是教师的原因你要下功夫弄清楚、理清楚,如果是听众的原因,你要问自己为什么要这样讲?需要怎样讲?应该怎样讲?可以怎样讲? 刘 伟 42 每个人都可以有理想, 人的一生有很多的不确定性。 将不确定的目标看作是可以实现的, 这就是理想。 将正在实现的目标看作是不确定的, 这就是现实。 -刘 伟43

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号