一元线性回归模型的置信区间与预测

上传人:壹****1 文档编号:429251982 上传时间:2023-03-06 格式:DOCX 页数:19 大小:128.88KB
返回 下载 相关 举报
一元线性回归模型的置信区间与预测_第1页
第1页 / 共19页
一元线性回归模型的置信区间与预测_第2页
第2页 / 共19页
一元线性回归模型的置信区间与预测_第3页
第3页 / 共19页
一元线性回归模型的置信区间与预测_第4页
第4页 / 共19页
一元线性回归模型的置信区间与预测_第5页
第5页 / 共19页
点击查看更多>>
资源描述

《一元线性回归模型的置信区间与预测》由会员分享,可在线阅读,更多相关《一元线性回归模型的置信区间与预测(19页珍藏版)》请在金锄头文库上搜索。

1、 2.5一元线性回归模型的置信区间与预测多元线性回归模型的置信区间问题包括参数估计量的置信区间和被解释变量预测值的置信区间两个方面,在数理统计学中属于区间估计问题。所谓区间估计是研究用未知参数的点估计值(从一组样本观测值算得的) 作为近似值的精确程度和误差范围,是一个必须回答的重要问题。一、参数估计量的置信区间在前面的课程中, 我们已经知道, 线性回归模型的参数估计量是随机变量yi的函数,即:?ki yi ,所以它也是随机变量。在多次重复抽样中,每次1的样本观测值不可能完全相同,所以得到的点估计值也不可能相同。现在我们用参数估计量的一个点估计值近似代表参数值,那么,二者的接近程度如何?以多大的

2、概率达到该接近程度?这就要构造参数的一个区间,以点估计值为中心的一个区间(称为置信区间) ,该区间以一定的概率(称为置信水平)包含该参数。即回答 1 以何种置信水平位于?a 之中,以及如何求得 a。1a, 1在变量的显著性检验中已经知道tii t (nk1)s i(2.5.1)这就是说,如果给定置信水平 1,从 t分布表中查得自由度为 (n-k-1)的临界值 t,那么 t 值处在 t 2 ,t2的概率是 1。表示为2P( ttt )122即P( tiit) 1s22iP( it s iits ) 12i2i于是得到:在( 1)的置信水平下i 的置信区间是( i ts , its )2i2i(2

3、.5.3 )i=0,1在某例子中,如果给定0.01,查表得t (nk1)t 0.005 (13)3.0122从回归计算中得到?102.3,?0.21, S ? 15, S ? 0.010101根 据 ( 2.5.2) 计 算 得 到0 ,1 的 置 信 区 间 分 别 为57.12,147.48 和( 0.1799,0.2401 )显然,参数 1 的置信区间要小。在实际应用中, 我们当然希望 置信水平越高越好,置信区间越小越好。如何才能缩小置信区间?从(2.5.3 )式中不难看出:( 1)增大样本容量 n。t在同样的置信水平下, n 越大,从 t 分布表中查得自由度为 ( n-k-1 )的临界

4、值2越小;同时,增大样本容量,在一般情况下可使估计值的标准差S? 减小,因为式中分母的增大是肯定的, 分子并不一定增大。(2)更主要的是提高模型的拟合度,以减小残差平方和ei2 。设想一种极端情况,如果模型完全拟合样本观测值,残差平方和为 0,则置信区间也为 0。(3)提高样本观测值的分散度。在一般情况下,样本观测值越分散,标准差越小。置信水平与置信区间是矛盾的。置t信水平越高,在其他情况不变时,临界值2 越大,置信区间越大。如果要求缩小置信区间,在其他情况不变时,就必须降低对置信水平的要求。二、预测值的置信区间1、点预测计量经济学模型的一个重要应用是经济预测。对于模型yi01 xiui ,

5、i1,2, n如果给定样本以外的解释变量的观测值x f ,有y f01 x fu f因 xf 是前述样本点以外的解释变量值,所以u f 和 ui i1,2, , n 是不相关的。引用已有的 OLS的估计值,可以得到被解释变量y f 的点预测值 :?(2.5.4)y f01x f但是,严格地说,这只是被解释变量的预测值的估计值,而不是预测值。原因在于两方面:一是模型中的参数估计量是不确定的,正如上面所说的; 二是随机项的影响。所以,我们得到的仅是预测值的一个估计值,预测值仅以某一个置信水平处于以该估计值为中心的一个区间中。于是,又是一个区间估计问题。2、区间预测如果已经知道实际的预测值y f ,

6、那么预测误差为efy fy?f显然, ef 是一随机变量,可以证明E e fE y fy?fE01 x fu fE?01 x f01 x f01 x f0而D e fCov ef , efCov y f?y f , y fy fCov y f , y f2Cov y f , y?fCov y?f, y?f2D y?f2Cov y f, y?fu因为 y?f 由原样本的 OLS估计值求得,而 y f与原样本不相关,故有:Cov y?0, D ef2?f, yfuD y f可以计算出来:?1x fx2D y fnunx ix2i1D e f1x fx21nunxix2i1(2.5.5)(2.5.6

7、)因 y?f 和 e f 均服从正态分布,可利用它们的性质构造统计量,求区间预测值。利用 y?f 构造统计量为:?E y fN ?y f N 0,1y f1x fx2nnxix 2ui 1将 u2 用估计值 ?u2 代入上式,有?E y ft y?fy f t n 21x fx2nn?uxix2i1这样,可得显著性水平下 E y f的置信区间为?1xfx2?1xfx2t 2n?,tn?(2.5.7)yfnuy f2nuxix 2xix 2i 1i 1(2.5.7)式称为 y f 的均值区间预测。同理,利用 e f 构造统计量,有efy f?Nefy f N 0,11xfx21x fx21nu1

8、nunxix2nxix2i1i1将 u2 用估计值 ?u2 代入上式,有:e fy f?t e fy f t n 21x fx211x fx21n?unn?unxix2xix2i1i1根据置信区间的原理,得显著性水平下 y f 的置信区间:?1x fx2?1x fx2t1n?,t1n?y fx 2uy fnxix 2u2nxi2i 1i1( 2.5.8 )上式称为 y f 的个值区间预测,显然,在同样的下,个值区间要大于均值区间。 (2.5.7)和(2.5.8) 也可表述为: y f 的均值或个值落在置信区间内的概率为 1,1即为预测区间的置信度。或者说,当给定解释变量值x f 后,只能得到被

9、解释变量 y f 或其均值 E y f 以 (1) 的置信水平处于某区间的结论。经常听到这样的说法, “如果给定解释变量值,根据模型就可以得到被解释变量的预测值为值” 。这种说法是不科学的,也是计量经济学模型无法达到的。如果一定要给出一个具体的预测值,那么它的置信水平则为 0;如果一定要回答解释变量以 100%的置信水平处在什么区间中,那么这个区间是。在实际应用中, 我们当然也希望置信水平越高越好, 置信区间越小越好, 以增加预测的实用意义。 如何才能缩小置信区间?从 (2.5.5 )和(2.5.6) 式中不难看出:(1)增大样本容量 n。在同样的置信水平下, n 越大,从 t 分布表中查得自由度为( n-k-1 )的临界值 t 越小;同时,增大样本容量,在一般情况下可使2?u2ei2( 2)更减小,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号