3多元线性回归与最小二乘估计

上传人:F****n 文档编号:102665012 上传时间:2019-10-04 格式:DOC 页数:12 大小:1.47MB
返回 下载 相关 举报
3多元线性回归与最小二乘估计_第1页
第1页 / 共12页
3多元线性回归与最小二乘估计_第2页
第2页 / 共12页
3多元线性回归与最小二乘估计_第3页
第3页 / 共12页
3多元线性回归与最小二乘估计_第4页
第4页 / 共12页
3多元线性回归与最小二乘估计_第5页
第5页 / 共12页
点击查看更多>>
资源描述

《3多元线性回归与最小二乘估计》由会员分享,可在线阅读,更多相关《3多元线性回归与最小二乘估计(12页珍藏版)》请在金锄头文库上搜索。

1、1.3 多元线性回归与最小二乘估计1假定条件、最小二乘估计量和高斯马尔可夫定理 多元线性回归模型:yt = b0 +b1xt1 + b2xt2 + bk- 1xt k -1 + ut , (1.1)其中yt是被解释变量(因变量),xt j是解释变量(自变量),ut是随机误差项,bi, i = 0, 1, , k - 1是回归参数(通常未知)。 对经济问题的实际意义:yt与xt j存在线性关系,xt j, j = 0, 1, , k - 1, 是yt的重要解释变量。ut代表众多影响yt变化的微小因素。使yt的变化偏离了E( yt) = b0 +b1xt1 + b2xt2 + bk- 1xt k

2、-1 决定的k维空间平面。 当给定一个样本(yt , xt1, xt2 , xt k -1), t = 1, 2, , T时, 上述模型表示为 y1 = b0 +b1x11 + b2x12 + bk- 1x1 k -1 + u1, 经济意义:xt j是yt的重要解释变量。 y2 = b0 +b1x21 + b2x22 + bk- 1x2 k -1 + u2, 代数意义:yt与xt j存在线性关系。 . 几何意义:yt表示一个多维平面。 yT = b0 +b1x T 1 + b2x T 2 + bk- 1x T k -1 + uT, (1.2)此时yt与x t i已知,bj与 ut未知。 (1.

3、3) Y = X b + u , (1.4)为保证得到最优估计量,回归模型(1.4)应满足如下假定条件。假定 随机误差项ut是非自相关的,每一误差项都满足均值为零,方差 s2相同且为有限值,即E(u) = 0 = , Var (u) = E( ) = s 2I = s 2假定 解释变量与误差项相互独立,即 E(X u) = 0假定 解释变量之间线性无关。rk(X X) = rk(X) = k 其中rk()表示矩阵的秩。假定 解释变量是非随机的,且当T 时T 1X X Q 其中Q是一个有限值的非退化矩阵。最小二乘 (OLS) 法的原理是求残差(误差项的估计值)平方和最小。代数上是求极值问题。mi

4、nS = (Y - X) (Y - X) = Y Y -X Y - Y X +X X = Y Y - 2X Y + X X (1.5)因为Y X是一个标量,所以有Y X = X Y。(1.5) 的一阶条件为:= - 2X Y + 2X X= 0 (1.6)化简得 X Y = X X因为 (X X) 是一个非退化矩阵(见假定),所以有= (X X)-1 X Y (1.7)因为X的元素是非随机的,(X X) -1X是一个常数矩阵,则是Y的线性组合,为线性估计量。求出,估计的回归模型写为Y = X+ (1.9)其中= ( ) 是 b 的估计值列向量,= (Y - X) 称为残差列向量。因为 = Y

5、- X= Y - X (X X)-1X Y = I - X (X X)-1 X Y (1.10)所以也是Y的线性组合。的期望和方差是 E() = E(X X)-1 X Y = E(X X)-1X (Xb + u) = b + (X X)-1X E(u) = b (1.11)Var() = E(b) (b)= E(X X)-1X u u X (X X)-1 = E(X X)-1X s 2I X (X X)-1 = s 2 (X X)-1 (1.12) 高斯马尔可夫定理:若前述假定条件成立,OLS估计量是最佳线性无偏估计量。具有无偏性。具有最小方差特性。具有一致性,渐近无偏性和渐近有效性。2. 残

6、差的方差s2 = / (T - k) (1.13)s 2是s 2 的无偏估计量,E(s 2 ) =s 2。的估计的方差协方差矩阵是() = s2 (X X)-1 (1.14)3. 多重确定系数(多重可决系数)Y = X+=+ (1.15)总平方和SST = = Y Y - T, (1.16)其中是yt 的样本平均数,定义为= 。回归平方和为SSR = = - T (1.17)其中的定义同上。残差平方和为SSE = = = (1.18)则有如下关系存在, SST = SSR + SSE (1.19)R2 = (1.20)显然有0 R 2 1。R 2 1,拟合优度越好。 4. 调整的多重确定系数当

7、解释变量的个数增加时,通常R2不下降,而是上升。为调整因自由度减小带来的损失,又定义调整的多重确定系数如下: = 1 - = 1 - (1.21) 5. OLS估计量的分布 若u N (0, s 2I ) ,则每个ut都服从正态分布。于是有Y N (Xb, s 2I ) (1.22)因也是u的线性组合(见公式1.7),依据(1.11)和(1.12)有 N ( b, s2(X X)-1 ) (1.23) 6. 方差分析与F检验与SST相对应,自由度T-1也被分解为两部分,(T-1)= (k -1) + (T- k) (1.24) 回归均方定义为MSR = ,误差均方定义为MSE = 表1.1 方

8、差分析表方差来源平方和自由度均方回归SSR =-T2k-1MSR = SSR / (k-1)误差SSE = T-kMSE = SSE / (T-k)总和SST= Y Y - T2T-1H0: b1= b2 = = bk-1 = 0; H1: bj不全为零F = = F(k-1,T-k) (1.25)设检验水平为a,则检验规则是,若 F Fa (k-1,T-k),接受H0;若 F Fa (k-1,T-k) , 拒绝H0。 0 Fa (k-1, T-k) -ta(T-k) 0 ta(T-k)F检验示意图 t检验示意图7t检验H 0:bj = 0, (j = 1, 2, , k-1), H 1:bj

9、 0t = t(T-k) (1.26)判别规则:若 t ta(T-k) 接受H 0;若 t ta(T-k) 拒绝H 0。 8bi的置信区间 (1) 全部bi的联合置信区间接受F = (b -) (X X) (b -) / s2 Fa (k, T-k) (1.27)( b -) (X X ) ( b -) s2 k Fa (k, T-k),它是一个k维椭球。 (1.28) (2) 单个bi的置信区间bi = s ta/2(T-k) . (1.29) 9预测 (1)点预测C = (1 xT+1 1 xT+1 2 xT+1 k-1 ) (1.30)则T + 1期被解释变量yT+1的点预测式是,= C

10、=0 +1 xT+1 1 + + k-1 xT+1 k-1 (1.31) (2)E(yT+1) 的置信区间预测 首先求点预测式C的抽样分布E() = E(C) = Cb (1.32)Var() = Var(C) = E(C- Cb ) (C- Cb ) = EC (- b ) C (- b ) = C E(- b ) (- b ) C = C Var()C = C s2 (X X )-1C = s2 C (X X )-1C , (1.33)因为服从多元正态分布,所以C也是一个多元正态分布变量,即= C N (Cb, s2C (X X ) -1C ) (1.34)构成 t 分布统计量如下t = t (T-k) (1.35)置信区间 C ta/2 (1, T-k) s

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 教学/培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号