一元线性回归模型的置信区间与预测讲义

上传人:简****9 文档编号:108082224 上传时间:2019-10-22 格式:DOC 页数:13 大小:229.02KB
返回 下载 相关 举报
一元线性回归模型的置信区间与预测讲义_第1页
第1页 / 共13页
一元线性回归模型的置信区间与预测讲义_第2页
第2页 / 共13页
一元线性回归模型的置信区间与预测讲义_第3页
第3页 / 共13页
一元线性回归模型的置信区间与预测讲义_第4页
第4页 / 共13页
一元线性回归模型的置信区间与预测讲义_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《一元线性回归模型的置信区间与预测讲义》由会员分享,可在线阅读,更多相关《一元线性回归模型的置信区间与预测讲义(13页珍藏版)》请在金锄头文库上搜索。

1、2.5 一元线性回归模型的置信区间与预测多元线性回归模型的置信区间问题包括参数估计量的置信区间和被解释变量预测值的置信区间两个方面,在数理统计学中属于区间估计问题。所谓区间估计是研究用未知参数的点估计值(从一组样本观测值算得的)作为近似值的精确程度和误差范围,是一个必须回答的重要问题。一、参数估计量的置信区间在前面的课程中,我们已经知道,线性回归模型的参数估计量是随机变量的函数,即:,所以它也是随机变量。在多次重复抽样中,每次的样本观测值不可能完全相同,所以得到的点估计值也不可能相同。现在我们用参数估计量的一个点估计值近似代表参数值,那么,二者的接近程度如何?以多大的概率达到该接近程度?这就要

2、构造参数的一个区间,以点估计值为中心的一个区间(称为置信区间),该区间以一定的概率(称为置信水平)包含该参数。即回答以何种置信水平位于之中,以及如何求得a。在变量的显著性检验中已经知道 (2.5.1)这就是说,如果给定置信水平,从t分布表中查得自由度为(n-k-1)的临界值,那么t值处在的概率是。表示为即于是得到:在()的置信水平下的置信区间是i=0,1 (2.5.3)在某例子中,如果给定,查表得从回归计算中得到根据(2.5.2)计算得到的置信区间分别为和(0.1799,0.2401)显然,参数的置信区间要小。在实际应用中,我们当然希望置信水平越高越好,置信区间越小越好。如何才能缩小置信区间?

3、从(2.5.3)式中不难看出:(1)增大样本容量n。在同样的置信水平下,n越大,从t分布表中查得自由度为(n-k-1)的临界值越小;同时,增大样本容量,在一般情况下可使估计值的标准差减小,因为式中分母的增大是肯定的,分子并不一定增大。(2)更主要的是提高模型的拟合度,以减小残差平方和。设想一种极端情况,如果模型完全拟合样本观测值,残差平方和为0,则置信区间也为0。(3)提高样本观测值的分散度。在一般情况下,样本观测值越分散,标准差越小。置信水平与置信区间是矛盾的。置信水平越高,在其他情况不变时,临界值越大,置信区间越大。如果要求缩小置信区间,在其他情况不变时,就必须降低对置信水平的要求。二、预

4、测值的置信区间1、 点预测计量经济学模型的一个重要应用是经济预测。对于模型,如果给定样本以外的解释变量的观测值,有因是前述样本点以外的解释变量值,所以和是不相关的。引用已有的OLS的估计值,可以得到被解释变量的点预测值: (2.5.4)但是,严格地说,这只是被解释变量的预测值的估计值,而不是预测值。原因在于两方面:一是模型中的参数估计量是不确定的,正如上面所说的;二是随机项的影响。所以,我们得到的仅是预测值的一个估计值,预测值仅以某一个置信水平处于以该估计值为中心的一个区间中。于是,又是一个区间估计问题。2、 区间预测如果已经知道实际的预测值,那么预测误差为显然,是一随机变量,可以证明而 因为

5、由原样本的OLS估计值求得,而与原样本不相关,故有:,可以计算出来: (2.5.5) (2.5.6)因和均服从正态分布,可利用它们的性质构造统计量,求区间预测值。利用构造统计量为:将用估计值代入上式,有这样,可得显著性水平下的置信区间为 (2.5.7)(2.5.7)式称为的均值区间预测。同理,利用构造统计量,有 将用估计值代入上式,有:根据置信区间的原理,得显著性水平下的置信区间:(2.5.8) 上式称为的个值区间预测,显然,在同样的下,个值区间要大于均值区间。(2.5.7)和(2.5.8)也可表述为:的均值或个值落在置信区间内的概率为,即为预测区间的置信度。或者说,当给定解释变量值后,只能得

6、到被解释变量或其均值以的置信水平处于某区间的结论。经常听到这样的说法,“如果给定解释变量值,根据模型就可以得到被解释变量的预测值为值”。这种说法是不科学的,也是计量经济学模型无法达到的。如果一定要给出一个具体的预测值,那么它的置信水平则为0;如果一定要回答解释变量以100%的置信水平处在什么区间中,那么这个区间是。在实际应用中,我们当然也希望置信水平越高越好,置信区间越小越好,以增加预测的实用意义。如何才能缩小置信区间?从(2.5.5)和(2.5.6)式中不难看出:(1)增大样本容量n。在同样的置信水平下,n越大,从t分布表中查得自由度为(n-k-1)的临界值越小;同时,增大样本容量,在一般情

7、况下可使减小,因为式中分母的增大是肯定的,分子并不一定增大。(2)更主要的是提高模型的拟合优度,以减小残差平方和。设想一种极端情况,如果模型完全拟合样本观测值,残差平方和为0,则置信区间长度也为0,预测区间就是一点。(3)提高样本观测值的分散度。在一般情况下,样本观测值越分散,作为分母的的值越大,致使区间缩小。置信水平与置信区间是矛盾的。置信水平越高,在其他情况不变时,临界值越大,置信区间越大。如果要求缩小置信区间,在其他情况不变时,就必须降低对置信水平的要求。四、一元线性回归模型参数估计实例为了帮助读者理解一元线性回归模型参数估计的原理,下面以我国国家财政文教科学卫生事业费支出模型为例,不采

8、用计量经济学应用软件,用手工计算,进行模型的参数估计。经分析得到,我国国家财政中用于文教科学卫生事业费的支出,主要由国家财政收入决定,二者之间具有线性关系。于是可以建立如下的模型:其中,为第t年国家文教科学卫生事业费支出额(亿元),为第t年国家财政收入额(亿元),为随机误差项,为待估计的参数。选取19911997年的数据为样本,利用(2.2.6)和(2.2.7)的计算公式,分别计算参数估计值。表2.2.1 有关数据表年份EDFI19917083149-551-2351734-26-0.03719927933483-466-2017804-11-0.01419939584349-301-1151

9、1001-43-0.04519941278521819-2821196820.0641995146762422087421424430.02919961704740844519081685190.01119971904865164531511963-59-0.031有关中间计算结果如下: 由电脑计算的参数估计值为 全部统计结果如下表。从表中可看出,判定系数0.99,表示以国家财政收入额来解释国家文教科学卫生事业费支出额,在1991至1997年间,拟合度相当理想。截距项的估计值对应的t-统计量为0.47,不能通过显著性检验,即不能推翻为0的假设;而一次系数的估计值对应的t-统计量为20.34,不

10、用查表即可知通过显著性检验,即显著不为0,因果关系成立。F-统计量的值为413.58,也表示方程系数显著不为0。表一:Eviews计算结果Dependent Variable: EDMethod: Least SquaresDate: 09/21/02 Time: 16:22Sample: 1991 1997Included observations: 7VariableCoefficientStd. Errort-StatisticProb. C30.0523763.906910.4702520.6580FI0.2234190.01098620.336590.0000R-squared0.9

11、88055 Mean dependent var1258.857Adjusted R-squared0.985666 S.D. dependent var459.8972S.E. of regression55.06160 Akaike info criterion11.08974Sum squared resid15158.90 Schwarz criterion11.07428Log likelihood-36.81408 F-statistic413.5768Durbin-Watson stat1.644626 Prob(F-statistic)0.000005表二:不含截距项的Evie

12、ws计算结果:Dependent Variable: EDMethod: Least SquaresDate: 09/21/02 Time: 16:19Sample: 1991 1997Included observations: 7VariableCoefficientStd. Errort-StatisticProb. FI0.2283040.00333768.408770.0000R-squared0.987526 Mean dependent var1258.857Adjusted R-squared0.987526 S.D. dependent var459.8972S.E. of

13、regression51.36364 Akaike info criterion10.84730Sum squared resid15829.34 Schwarz criterion10.83957Log likelihood-36.96556 Durbin-Watson stat1.630622Dependent Variable: LEDMethod: Least SquaresDate: 09/21/02 Time: 16:21Sample: 1991 1997Included observations: 7VariableCoefficientStd. Errort-Statistic

14、Prob. C-1.5223290.383141-3.9732900.0106LFI1.0055630.04476422.463410.0000R-squared0.990188 Mean dependent var7.077084Adjusted R-squared0.988226 S.D. dependent var0.382958S.E. of regression0.041554 Akaike info criterion-3.288701Sum squared resid0.008634 Schwarz criterion-3.304156Log likelihood13.51045 F-statistic504.6048Durbin-Watson stat1.930000 Prob(F-statistic)0.000003多元线性回归模型的参数估计实例例2.3.1 建立中国消费模型。根据消费模型的

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业/管理/HR > 管理学资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号