[财务管理财务知识 ]计量经济学系列讲义元线性回归模型检验精编

上传人:卓****库 文档编号:174252415 上传时间:2021-03-15 格式:DOCX 页数:9 大小:346.81KB
返回 下载 相关 举报
[财务管理财务知识 ]计量经济学系列讲义元线性回归模型检验精编_第1页
第1页 / 共9页
[财务管理财务知识 ]计量经济学系列讲义元线性回归模型检验精编_第2页
第2页 / 共9页
[财务管理财务知识 ]计量经济学系列讲义元线性回归模型检验精编_第3页
第3页 / 共9页
[财务管理财务知识 ]计量经济学系列讲义元线性回归模型检验精编_第4页
第4页 / 共9页
[财务管理财务知识 ]计量经济学系列讲义元线性回归模型检验精编_第5页
第5页 / 共9页
点击查看更多>>
资源描述

《[财务管理财务知识 ]计量经济学系列讲义元线性回归模型检验精编》由会员分享,可在线阅读,更多相关《[财务管理财务知识 ]计量经济学系列讲义元线性回归模型检验精编(9页珍藏版)》请在金锄头文库上搜索。

1、财务管理财务知识计量经济学系列讲义元线性回归模型检验2.3一元线性回归模型的统计检验回归分析是要通过样本所估计的参数来代替总体的真实参数,或者说是用样本回归线代替总体回归线。尽管从统计性质上已知,如果有足够多的重复抽样,参数的估计值的期望(均值)就等于其总体的参数真值,但在一次抽样中,估计值不一定就等于该真值。那么,在一次抽样中,参数的估计值与真值的差异有多大,是否显著,这就需要进一步进行统计检验。主要包括拟合优度检验、变量的显著性检验及参数的区间估计。一、拟合优度检验拟合优度检验,顾名思义,是检验模型对样本观测值的拟合程度。检验的方法,是构造一个可以表征拟合程度的指标,在这里称为统计量,统计

2、量是样本的函数。从检验对象中计算出该统计量的数值,然后与某一标准进行比较,得出检验结论。有人也许会问,采用普通最小二乘估计方法,已经保证了模型最好地拟合了样本观测值,为什么还要检验拟合程度?问题在于,在一个特定的条件下做得最好的并不一定就是高质量的。普通最小二乘法所保证的最好拟合,是同一个问题内部的比较,拟合优度检验结果所表示优劣是不同问题之间的比较。例如图2.3.1和图2.3.2中的直线方程都是由散点表示的样本观测值的最小二乘估计结果,对于每个问题它们都满足残差的平方和最小,但是二者对样本观测值的拟合程度显然是不同的。图2.3.1图2.3.21、总离差平方和的分解已知由一组样本观测值,=1,

3、2,n得到如下样本回归直线而的第个观测值与样本均值的离差可分解为两部分之和:(2.3.1)图2.3.3示出了这种分解,其中,是样本回归直线理论值(回归拟合值)与观测值的平均值之差,可认为是由回归直线解释的部分;是实际观测值与回归拟合值之差,是回归直线不能解释的部分。显然,如果落在样本回归线上,则的第个观测值与样本均值的离差,全部来自样本回归拟合值与样本均值的离差,即完全可由样本回归线解释。表明在该点处实现完全拟合。Y=来自残差SRF=总离差=来自回归X图2.3.3对于所有样本点,则需考虑这些点与样本均值离差的平方和。由于可以证明,所以有(2.3.2)记,称为总离差平方和(TotalSumofS

4、quares),反映样本观测值总体离差的大小;,称为回归平方和(ExplainedSumofSquares),反映由模型中解释变量所解释的那部分离差的大小;,称为残差平方和(ResidualSumofSquares),反映样本观测值与估计值偏离的大小,也是模型中解释变量未解释的那部分离差的大小。(2.3.2)表明的观测值围绕其均值的总离差平方和可分解为两部分,一部分来自回归线,另一部分则来自随机势力。因此,可用来自回归线的回归平方和占Y的总离差的平方和的比例来判断样本回归线与样本观测值的拟合优度。读者也许会问,既然反映样本观测值与估计值偏离的大小,可否直接用它作为拟合优度检验的统计量?这里提出

5、了一个普遍的问题,即作为检验统计量的一般应该是相对量,而不能用绝对量。因为用绝对量作为检验统计量,无法设置标准。在这里,即残差平方和,与样本容量关系很大,当n比较小时,它的值也较小,但不能因此而判断模型的拟合优度就好。2、可决系数统计量根据上述关系,可以用(2.3.3)检验模型的拟合优度,称为可决系数(coefficientofdetermination)。显然,在总离差平方和中,回归平方和所占的比重越大,残差平方和所占的比重越小,则回归直线与样本点拟合得越好。如果模型与样本观测值完全拟合,则有。当然,模型与样本观测值完全拟合的情况是不可能发生的,不可能等于1。但毫无疑问的是该统计量越接近于1

6、,模型的拟合优度越高。在实际计算可决系数时,在已经估计出后,一个较为简单的计算公式为:(2.3.4)这里用到了样本回归函数的离差形式来计算回归平方和:。在例2.1.1的收入-消费支出例中,说明在线性回归模型中,家庭消费支出总变差(variation)中,由家庭可支配收入的变差解释的部分占97.66%,模型的拟合优度较高。由(2.3.3)知,可决系数的取值范围为,是一个非负的统计量。它也是随着抽样的不同而不同,即是随抽样而变动的统计量。为此,对可决系数的统计可靠性也应进行检验,这将在第3章中进行。二、变量的显著性检验变量的显著性检验,旨在对模型中被解释变量与解释变量之间的线性关系是否显著成立作出

7、推断,或者说考察所选择的解释变量是否对被解释变量有显著的线性影响。从上面的拟合优度检验中可以看出,拟合优度高,则解释变量对被解释变量的解释程度就高,线性影响就强,可以推测模型线性关系成立;反之,就不成立。但这只是一个模糊的推测,不能给出一个统计上的严格的结论。因此,还必须进行变量的显著性检验。变量的显著性检验所应用的方法是数理统计学中假设检验。1、假设检验假设检验是统计推断的一个主要内容,它的基本任务是根据样本所提供的信息,对未知总体分布的某些方面的假设作出合理的判断。假设检验的程序是,先根据实际问题的要求提出一个论断,称为统计假设,记为;然后根据样本的有关信息,对的真伪进行判断,作出拒绝或接

8、受的决策。假设检验的基本思想是概率性质的反证法。为了检验原假设是否正确,先假定这个假设是正确的,看由此能推出什么结果。如果导致一个不合理的结果,则表明“假设为正确”是错误的,即原假设不正确,因此要拒绝原假设。如果没有导致一个不合理现象的出现,则不能认为原假设不正确,因此不能拒绝拒绝原假设。概率性质的反证法的根据是小概率事件原理,该原理认为“小概率事件在一次试验中几乎是不可能发生的”。在原假设下构造一个事件,这个事件在“原假设是正确”的条件下是一个小概率事件。随机抽取一组容量为n的样本观测值进行该事件的试验,如果该事件发生了,说明“原假设是正确”是错误的,因为不应该出现的小概率事件出现了。因而应

9、该拒绝原假设。反之,如果该小概率事件没有出现,就没有理由拒绝原假设,应该接受原假设。2、变量的显著性检验用以进行变量显著性检验的方法主要有三种:F检验、t检验、z检验。它们的区别在于构造的统计量不同。应用最为普遍的t检验,在目前使用的计量经济学软件包中,都有关于t统计量的计算结果。我们在此只介绍t检验。对于一元线性回归方程中的,已经知道它服从正态分布进一步根据数理统计学中的定义,如果真实的未知,而用它的无偏估计量替代时,可构造如下统计量(2.3.5)则该统计量服从自由度为的分布。因此,可用该统计量作为显著性检验的统计量。如果变量是显著的,那么参数应该显著地不为0。于是,在变量显著性检验中设计的

10、原假设为:给定一个显著性水平,查分布表(见附录),得到一个临界值。因为分布是双尾分布,所以按照查分布表中的临界值。于是(这里的已不同于(2.3.5)式,其中)为原假设下的一个小概率事件。在参数估计完成后,可以很容易计算的数值。如果发生了,则在(1)的置信度下拒绝原假设,即变量X是显著的,通过变量显著性检验。如果未发生,则在(1)置信度下接受原假设,即变量X是不显著的,未通过变量显著性检验。对于一元线性回归方程中的,可构造如下t统计量进行显著性检验:(2.3.6)同样地,该统计量服从自由度为的分布,检验的原假设一般仍为。在例2.1.1及例2.2.1的收入-消费支出例中,首先计算的估计值于是和的标

11、准差的估计值分别是:t统计量的计算结果分别为:给定一个显著性水平=0.05,查分布表中自由度为8(在这个例中)、=0.05的临界值,得到2.306。可见,说明解释变量家庭可支配收入在95%的置信度下显著,即通过了变量显著性检验。但,表明在95%的置信度下,无法拒绝截距项为零的假设。三、参数的置信区间假设检验可以通过一次抽样的结果检验总体参数可能的假设值的范围(最常用的假设为总体参数值为零),但它并没有指出在一次抽样中样本参数值到底离总体参数的真值有多“近”。要判断样本参数的估计值在多大程度上可以“近似”地替代总体参数的真值,往往需要通过构造一个以样本参数的估计值为中心的“区间”,来考察它以多大

12、的可能性(概率)包含着真实的参数值。这种方法就是参数检验的置信区间估计。要判断估计的参数值离真实的参数值有多“近”,可预先选择一个概率,并求一个正数,使得随机区间(randominterval)包含参数的真值的概率为1-。即:如果存在这样一个区间,称之为置信区间(confidenceinterval);1-称为置信系数(置信度)(confidencecoefficient),称为显著性水平(levelofsignificance);置信区间的端点称为置信限(confidencelimit)或临界值(criticalvalues)。在变量的显著性检验中已经知道:这就是说,如果给定置信度,从分布表

13、中查得自由度为的临界值,那么值处在的概率是。表示为:即于是得到的置信度下的置信区间是(2.3.6)在例2.1.1与2.2.1中,如果给定,查表得:从假设检验中已得到:,于是,根据(2.3.6)计算得到、的置信区间分别为(0.6345,0.9195)(-433.32,226.98)显然,参数的置信区间小于的置信区间。由于置信区间一定程度地给出了样本参数估计值与总体参数真值的“接近”程度,因此置信区间越小越好。如何才能缩小置信区间?从(2.3.6)式不难看出:(1)增大样本容量n。在同样的样本容量下,n越大,t分布表中的临界值越小;同时,增大样本容量,还可使样本参数估计量的标准差减小;(2)提高模型的拟合优度,因为样本参数估计量的标准差与残差平方和呈正比,模型优度越高,残差平方应越小。多年企业管理咨询经验,专注为企业和个人提供精品管理方案,企业诊断方案,制度参考模板等欢迎您下载,均可自由编辑感谢阅读

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 总结/报告

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号