一元线性回归的假设检验

上传人:简****9 文档编号:107475135 上传时间:2019-10-19 格式:PPT 页数:57 大小:680.50KB
返回 下载 相关 举报
一元线性回归的假设检验_第1页
第1页 / 共57页
一元线性回归的假设检验_第2页
第2页 / 共57页
一元线性回归的假设检验_第3页
第3页 / 共57页
一元线性回归的假设检验_第4页
第4页 / 共57页
一元线性回归的假设检验_第5页
第5页 / 共57页
点击查看更多>>
资源描述

《一元线性回归的假设检验》由会员分享,可在线阅读,更多相关《一元线性回归的假设检验(57页珍藏版)》请在金锄头文库上搜索。

1、第五章:一元线性回归模型的假设检验,目录,第一节 经典线性回归模型的基本假定 第二节 OLS估计量的性质:高斯-马尔可夫定理 第三节 一元线性回归模型的假设检验 第四节 预测 考核要求和作业,第一节 经典线性回归模型的基本假定,经典线性回归模型:classical liner regression model ,CLRM 一、9个假定 二、假定的意义 返回,一、9个假定,1、零均值假定 2、同方差假定 3、无自相关假定 4、随机误差项和解释变量不相关假定 5、正态性假定 6、样本容量N待估参数个数 7、解释变量 X值有变异性 8、无多重共线性假定 9、参数线性假定,零均值假定,假定1:随机误差

2、项均值为零 随机误差项囊括了大量未包括进模型的各种变量影响之和,他们相互抵消,对被解释变量没有系统性影响 E(|Xi)=0,简写为E(i)=0,随机误差项均值为零 p123 图7-1,X=900,X=1000,X=1100,散点图,Y,X,具体的支出水平是围绕其条件均值波动的,这种波动的“均值为0”,同方差假定,假定2:随机误差项方差相同 即与给定X相对应的Y值以相同方差分布在其条件均值周围。 如果不满足这个假定,即为“异方差” 异方差的图示,异方差的图示,X=900,X=1000,X=1000时,Y的分布更靠拢均值。即方差相对较小。,无自相关假定,假定3:无自相关,即两个随机误差项之间不相关

3、 也称无序列自相关,两个随机误差项之间不相关,即两个Y之间也不相关。,假定4:随机误差项和解释变量不相关 当X是非随机的时,该假定自动满足 X是抽样时候人为设定的:比如前例中把家庭收入分组 假定5:正态性假定:随机误差项服从正态分布,假定6:样本容量N待估参数个数 假定7:解释变量 X值有变异性 即X有一个相对较大的取值范围 如果X只在一个狭窄的范围内变动,则无法充分估计X对被解释变量Y的系统影响。 例:如果收入差异不大,我们无法观察支出Y的变动 假定8 :如果有多个解释变量,要求解释变量间没有很强的线性关系 无多重共线性 假定9:线性:回归模型对参数而言是线性的,二、假定的意义,如果满足这些

4、假定,则高斯-马尔可夫定理成立: 在所有线性无偏估计量中,普通最小二乘(OLS)估计量有最小方差。这使得OLS估计量有着优良的性质可以进行统计推断 完全满足这些假定的方程在现实中是不存在的,但这些假定为我们提供了一个比较的基准,本课其他部分主要是围绕假定不被满足时,分析后果,提出解决办法。返回,第二节 OLS估计量的性质:高斯-马尔可夫定理 p127,一、高斯-马尔可夫定理 二、ols估计量的概率分布 返回,一、高斯-马尔可夫定理,在所有线性无偏估计量中,普通最小二乘(OLS)估计量有最小方差。 即OLS估计量是最佳线性无偏估计量 1、线性 2、无偏性 3、最小方差性 4、小结 返回,高斯-马

5、尔科夫理论所考虑的各种估计值分类图,返回,1、线性性:参数估计量是被解释变量Yi的线性组合:,返回,2、无偏性,估计量的均值=其对应参数的真值,返回,3、最小方差性,附:证明,* 再证明最小方差性:在所有线性无偏估计量中,ols估计量方差最小:,返回,4、小结:估计量的统计性质,3)最小方差性:,且在所有线性无偏估计量中方差最小,返回,二、ols估计量的概率分布 p129,假设检验需要指明总体参数(即总体回归系数)的估计量(即样本回归系数)服从何种分布 如同需要指明样本均值服从何种分布,才可对总体均值进行统计推断一样。 样本回归系数是Y的线性函数,因此其概率分布取决于Y,而Y的概率分布取决于随

6、机误差项 返回,有了样本回归系数的OLS估计量的分布信息,就可以利用它进行总体回归系数的统计推断,1、正态性假定:随机误差项服从正态分布, 随机扰动项代表了未引入模型的随机影响之和,依据中心极限定理,大量独立同分布的随机变量之和趋向于正态分布 2、服从正态分布的变量的线性组合依然服从正态分布,则,返回,第三节 一元线性回归模型的假设检验 p130,一、检验 二、参数的显著性检验 三、回归的拟合优度检验 四、回归分析结果的报告 五、综合实例:美国商业部门工资和生产率的关系 返回,一、检验,对模型和所估计的参数加以评定,判断在经济理论上是否有意义,在统计上是否显著等。 检验包括: 1)经济意义的检

7、验 2)统计推断检验* 3)计量经济学检验* 4)预测检验* 返回,二、参数的显著性检验 p132,1、“稻草人假设” 2、ols估计量服从t分布 3、检验步骤 4、例题 返回,回归分析是要判断解释变量X是否是被解释变量Y的一个显著性的影响因素。 在一元线性模型中,就是要判断X是否对Y具有显著的线性性影响。这就需要进行变量的显著性检验。,计量经计学中,主要是针对变量的参数真值是否为“零”来进行显著性检验的。即 这样的零假设也称为“稻草人假设”,如果稻草人假设成立,说明解释变量X不是被解释变量Y的一个显著性的影响因素 返回,1、稻草人假设,2、ols估计量服从t分布,返回,3、检验步骤:,(1)

8、对总体参数提出假设 H0: b1=0, H1:b10,(2)以原假设H0构造t统计量,并由样本计算其值,(3)给定显著性水平,查t分布表,得临界值t /2,df=(n-2),(4) 比较,判断 若 |t| t /2(n-2),则拒绝H0 ,接受H1 ; 若 |t| t /2(n-2),则拒绝H1 ,接受H0 ;返回,4、例题:葡萄酒拍卖价格的回归分析,数据 应变量: ln(price): 19521980年间共10批,用来自六个葡萄种植场的的葡萄酿造的60种不同葡萄酒的价格,取其对数形式 自变量: Age: 葡萄酒存放年数 Temp:葡萄生长期平均气温 Rain:8/9月份降雨量 Wrain:

9、葡萄生长期前一年10月到次年3月降雨量,回归结果(括号里数据为标准误差),返回,三、拟合优度检验P134,对样本回归直线与样本观测值之间拟合程度的检验。度量拟合优度的指标:判定系数(可决系数)R2 1、 总离差平方和的分解 2、几个概念 3、判定系数R2统计量 4、例题 返回,1、总离差平方和的分解,已知由一组样本观测值(Xi,Yi),i=1,2,n得到如下样本回归直线,当Yi=i 即实际观测值落在样本回归“线”上,则拟合最好。 可认为,“离差”全部来自回归线,而与“残差”无关。返回,2、几个概念:对于所有样本点,则需考虑这些点与样本均值离差的平方和,可以证明:,记,总体平方和(Total S

10、um of Squares),回归平方和(Explained Sum of Squares),残差平方和(Residual Sum of Squares ),TSS=ESS+RSS,Y的观测值围绕其均值的总离差(total variation)可分解为两部分:一部分来自回归线(ESS),另一部分则来自随机势力(RSS)。,在给定样本中,TSS不变, 如果实际观测点离样本回归线越近,则ESS在TSS中占的比重越大,因此 拟合优度:回归平方和ESS/Y的总离差TSS 返回,3、判定系数R2统计量,称 R2 为(样本)可决系数/判定系数(coefficient of determination)。,

11、可决系数的取值范围:0,1 R2=1,即RSS=0,即完全拟合 返回 样本相关系数r和R2的关系:,4、例题 葡萄酒价格预测,数据 应变量: ln(price): 19521980年间共10批,用来自六个葡萄种植场的的葡萄酿造的60种不同葡萄酒的价格,取其对数形式 自变量: Age: 葡萄酒存放年数 Temp:葡萄生长期平均气温 Rain:8/9月份降雨量 Wrain:葡萄生长期前一年10月到次年3月降雨量,回归结果(括号里数据为标准误差),返回,四、回归分析结果的报告 p137,1、手工报告 2、计算机输出结果,五、综合实例:美国商业部门工资和生产率的关系,p140,设在收入-消费支出例中,

12、得到的样本回归函数为,则在 X0=1000处, 0 = 103.172+0.7771000=673.84 一、点预测 二、区间估计 返回,第四节 预测,一、点预测:对于一元线性回归模型,给定样本以外的解释变量的观测值X0,可以得到被解释变量的预测值0 ,可以此作为其条件均值E(Y|X=X0)或个别值Y0的一个近似估计。 1、0是条件均值E(Y|X=X0) 的一个无偏估计 2、 返回,1、0是条件均值E(Y|X=X0)的一个无偏估计,对总体回归函数E(Y|X=X0)=0+1X,X=X0时 E(Y|X=X0)=0+1X0,于是,可见,0是条件均值E(Y|X=X0)的无偏估计。返回,2、对总体回归模

13、型Y=0+1X+,当X=X0时,于是,返回,二、区间估计:总体条件均值与个值预测值的置信区间,1、总体均值预测值的置信区间 2、总体个值预测值的预测区间 3、例题 4、一些结论 返回,1、总体均值预测值的置信区间,由于,于是,可以证明,因此,故,其中,于是,在1-的置信度下,总体均值E(Y|X0)的置信区间为,返回,2、总体个值预测值的预测区间,由 Y0=0+1X0+ 知:,于是,式中 :,从而在1-的置信度下, Y0的置信区间为,返回,3、例题:在上述收入-消费支出例中,得到的样本回归函数为,则在 X0=1000处, 0 = 103.172+0.7771000=673.84,而,因此,总体均

14、值E(Y|X=1000)的95%的置信区间为: 673.84-2.30661.05 E(Y|X=1000) 673.84+2.30661.05 或 (533.05, 814.62),同样地,对于Y在X=1000的个体值,其95%的置信区间为: 673.84 - 2.30661.05Yx=1000 673.84 + 2.30661.05 或 (372.03, 975.65),总体回归函数的置信带(域)(confidence band) 个体的置信带(域),返回,4、一些结论:对于Y的总体均值E(Y|X)与个体值的预测区间(置信区间):,(1)样本容量n越大,预测精度越高 (2)样本容量一定时,置信带的宽度当在X均值处最小,其附近进行预测(插值预测)精度越大;X越远离其均值,置信带越宽,预测可信度下降。 (3)样本方差越小,预测精度越高,返回,讨论 P146 :7.2 作业 P147:7.8 7.10 7.11,本章逻辑,我们需要进行: 参数显著性检验 拟合优度检验 回归总体线性检验 而高斯-马尔科夫定理给出了进行统计检验的信息 而高斯-马尔科夫定理的成立需要一些假定条件,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业/管理/HR > 管理学资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号