计量经济3多元线性回归模型ppt课件

上传人:ni****g 文档编号:589179026 上传时间:2024-09-10 格式:PPT 页数:131 大小:1.12MB
返回 下载 相关 举报
计量经济3多元线性回归模型ppt课件_第1页
第1页 / 共131页
计量经济3多元线性回归模型ppt课件_第2页
第2页 / 共131页
计量经济3多元线性回归模型ppt课件_第3页
第3页 / 共131页
计量经济3多元线性回归模型ppt课件_第4页
第4页 / 共131页
计量经济3多元线性回归模型ppt课件_第5页
第5页 / 共131页
点击查看更多>>
资源描述

《计量经济3多元线性回归模型ppt课件》由会员分享,可在线阅读,更多相关《计量经济3多元线性回归模型ppt课件(131页珍藏版)》请在金锄头文库上搜索。

1、第三章第三章 经典一方程计量经济学模型:经典一方程计量经济学模型:多元线性回归模型多元线性回归模型 多元线性回归模型多元线性回归模型 多元线性回归模型的参数估计多元线性回归模型的参数估计多元线性回归模型的统计检验多元线性回归模型的统计检验多元线性回归模型的预测多元线性回归模型的预测回归模型的其他方式回归模型的其他方式回归模型的参数约束回归模型的参数约束3.1 3.1 多元多元线线性回性回归归模型模型 一、多元线性回归模型一、多元线性回归模型 二、多元线性回归模型的根本假定二、多元线性回归模型的根本假定 一、多元线性回归模型一、多元线性回归模型 多元多元线线性回性回归归模型模型:表如今表如今线线

2、性回性回归归模型模型中的解中的解释变释变量有多个。量有多个。 普通表普通表现现方式:方式:i=1,2,n其中:k为解释变量的数目,j称为回归参数regression coefficient。也也被被称称为为总总体体回回归归函函数数的的随随机机表表达达方方式式。它它 的的非随机表达式为非随机表达式为:表示:各表示:各变变量量X值值固定固定时时Y的平均呼的平均呼应应。 习惯上:把常数项看成为一虚变量的系数,该习惯上:把常数项看成为一虚变量的系数,该虚变量的样本观测值一直取虚变量的样本观测值一直取1。于是:。于是:模型中解释变量的数目为模型中解释变量的数目为k+1 总体回归模型n个随机方程的矩阵表达

3、式为: 其中其中 j也被称为偏回归系数,表示在其他解释变量坚持不变的情况下,X j每变化1个单位时,Y的均值E(Y)的变化; 或者说j给出了X j的单位变化对Y均值的“直接或“净不含其他变量影响。用来估计总体回归函数的样本回归函数为:其随机表示式其随机表示式: : ei称称为为残差或剩余残差或剩余项项(residuals),可看成是,可看成是总总体回体回归归函数中随机函数中随机扰动项扰动项i的近似替代。的近似替代。 样样本回本回归归函数的矩函数的矩阵阵表达表达: 或或其中:其中:二、多元线性回归模型的根本假定二、多元线性回归模型的根本假定 假设1,解释变量是非随机的或固定的,且各X之间互不相关

4、无多重共线性。 假设2,随机误差项具有零均值、同方差及不序列相关性。 假设3,解释变量与随机项不相关 假设4,随机项满足正态分布 上述假设的矩阵符号表示上述假设的矩阵符号表示 式:式: 假设1,n(k+1)矩阵X是非随机的,且X的秩=k+1,即X满秩。 假设2, 假设4,向量 有一多维正态分布,即 同一元回同一元回归归一一样样,多元回,多元回归还归还具有如下两个重要假具有如下两个重要假设设: 假假设设5 5,样样本容量本容量趋趋于无于无穷时穷时,各解,各解释变释变量的方差量的方差趋趋于于有界常数,即有界常数,即n n时时, 假设3,E(X)=0,即 其中:Q为一非奇特固定矩阵,矩阵x是由各解释

5、变量的离差为元素组成的nk阶矩阵 假设6,回归模型的设定是正确的。 或3.2 3.2 多元多元线线性回性回归归模型的估模型的估计计 一、普通最小二乘估计一、普通最小二乘估计 * *二、最大或然估计二、最大或然估计 * *三、矩估计三、矩估计 四、参数估计量的性质四、参数估计量的性质 五、样本容量问题五、样本容量问题 六、估计实例六、估计实例 说说 明明估计方法:估计方法:3大类方法:大类方法:OLS、ML或者或者MM在经典模型中多运用在经典模型中多运用OLS在非经典模型中多运用在非经典模型中多运用ML或者或者MM在本节中,在本节中, ML与与MM为选学内容为选学内容一、普通最小二乘估计一、普通

6、最小二乘估计对于随机抽取的n组观测值假设样本函数的参数估计值曾经得到,那么有: i=1,2n 根据最小二乘原理,参数估计值应该是右列方程组的解 其中 于是得到关于待估参数估计值的正规方程组: 解该k+1 个方程组成的线性代数方程组,即可得到(k+1) 个待估参数的估计值$, , ,bjj =012L。k正正规规方程方程组组的矩的矩阵阵方式方式即由于XX满秩,故有 将上述过程用矩阵表示如下: 即求解方程组:得到: 于是:例例3.2.1:在例:在例2.1.1的家庭收入的家庭收入-消消费费支出例中,支出例中, 可求得: 于是: 正规方程组 的另一种写法对于正规方程组 于是 或 (*)或*是多元线性回

7、归模型正规方程组的另一种写法。 (*)(*)样本回归函数的离差方式i=1,2n 其矩阵方式为:其中 : 在离差方式下,参数的最小二乘估计结果为 随机误差项的方差的无偏估计 可以证明,随机误差项的方差的无偏估计量为: * *二、最大或然估计二、最大或然估计对于多元线性回归模型易知Y的随机抽取的n组样本观测值的结合概率 对数或然函数为对对数或然函数求极大值,也就是对 求极小值。即为变量Y的或然函数 因此,参数的最大或然估计为结结果与参数的普通最小二乘估果与参数的普通最小二乘估计计一一样样* *三、矩估计三、矩估计Moment Method, MMMoment Method, MM OLS估计是经过

8、得到一个关于参数估计值的正规方程组并对它进展求解而完成的。 该正规方程组该正规方程组 可以从另外一种思绪来导可以从另外一种思绪来导: : 求期望 :称为原总体回归方程的一组矩条件,阐明了原总体回归方程所具有的内在特征。 由此得到正规方程组 解此正规方程组即得参数的MM估计量。 易知MM估计量与OLS、ML估计量等价。矩方法是工具变量方法矩方法是工具变量方法(Instrumental Variables,IV)和广义矩估计方法和广义矩估计方法(Generalized Moment Method, GMM)的根底的根底 在矩方法中利用了关在矩方法中利用了关键键是是 E(X)=0 假假设设某个解某个

9、解释变释变量与随机量与随机项项相关,只需能找到相关,只需能找到1个工具个工具变变量,依然可以构成一量,依然可以构成一组组矩条件。矩条件。这这就是就是IV。 假假设设存在存在k+1个个变变量与随机量与随机项项不相关,可以构不相关,可以构成一成一组组包含包含k+1方程的矩条件。方程的矩条件。这这就是就是GMM。 四、参数估计量的性质四、参数估计量的性质 在满足根本假设的情况下,其构造参数的普通最小二乘估计、最大或然估计及矩估计仍具有: 线性性、无偏性、有效性。 同时,随着样本容量添加,参数估计量具有: 渐近无偏性、渐近有效性、一致性。 1、线线性性性性 其中,C=(XX)-1 X 为一仅与固定的X

10、有关的行向量 2、无偏性、无偏性 3、有效性、有效性 最小方差性最小方差性 这里利用了假设: E(X)=0其中利用了 和 五、样本容量问题五、样本容量问题 所所谓谓“最小最小样样本容量,即从最小二乘原理本容量,即从最小二乘原理和最大或然原理出和最大或然原理出发发,欲得到参数估,欲得到参数估计计量,不量,不论论其其质质量如何,所要求的量如何,所要求的样样本容量的下限。本容量的下限。 最小最小样样本容量本容量 样样本最小容量必需不少于模型中解本最小容量必需不少于模型中解释变释变量量的数目的数目 包括常数包括常数项项 , ,即即 n k+1 n k+1由于,无多重共由于,无多重共线线性要求:秩性要求

11、:秩(X)=k+1(X)=k+1 2 2、满足根本要求的样本容量、满足根本要求的样本容量 从从统计检验统计检验的角度:的角度: n n30 30 时时,Z Z检验检验才干运用;才干运用; n-k8 n-k8时时, t, t分布分布较为稳较为稳定定 普通阅历以为: 当n30或者至少n3(k+1)时,才干说满足模型估计的根本要求。 模型的良好性模型的良好性质质只需在大只需在大样样本下才干本下才干得到得到实际实际上的上的证证明明 六、多元线性回归模型的参数估计实例六、多元线性回归模型的参数估计实例 例3.2.2 在例2.5.1中,已建立了中国居民人均消费一元线性模型。这里我们再思索建立多元线性模型。

12、解解释变释变量:人均量:人均GDP:GDPP 前期消前期消费费:CONSP(-1)估估计计区区间间:19792000年年Eviews软件估计结果 3.3 3.3 多元多元线线性回性回归归模型的模型的统计检验统计检验 一、拟合优度检验一、拟合优度检验 二、方程的显著性检验二、方程的显著性检验(F(F检验检验) ) 三、变量的显著性检验三、变量的显著性检验t t检验检验 四、参数的置信区间四、参数的置信区间 一、拟合优度检验一、拟合优度检验1、可决系数与、可决系数与调调整的可决系数整的可决系数那么 总总离差平方和的分解离差平方和的分解由于: =0所以有: 留意:一个有趣的景象留意:一个有趣的景象

13、可决系数该统计量越接近于1,模型的拟合优度越高。 问题:在运用过程中发现,假设在模型中添加一个解释变量, R2往往增大Why?) 这就给人一个错觉:要使得模型拟合得好,只需添加解释变量即可。 但是,现实情况往往是,由添加解释变量个数引起的R2的增大与拟合好坏无关,R2需调整。 调整的可决系数adjusted coefficient of determination 在样本容量一定的情况下,添加解释变量必定使得自在度减少,所以调整的思绪是:将残差平方和与总离差平方和分别除以各自的自在度,以剔除变量个数对拟合优度的影响:其中:n-k-1为残差平方和的自在度,n-1为总体平方和的自在度。 *2、赤池

14、信息准那么和施瓦茨准那么、赤池信息准那么和施瓦茨准那么 为了比较所含解释变量个数不同的多元回归模型的拟合优度,常用的规范还有: 赤池信息准那么Akaike information criterion, AIC施瓦茨准那么施瓦茨准那么 Schwarz criterionSchwarz criterion,SCSC 这两准那么均要求仅当所添加的解释变量可以减少AIC值或AC值时才在原模型中添加该解释变量。 Eviews的估计结果显示: 中国居民消费一元例中: AIC=6.68 AC=6.83 中国居民消费二元例中: AIC=7.09 AC=7.19从这点看,可以说前期人均居民消费CONSP(-1)

15、应包括在模型中。 二、方程的显著性检验二、方程的显著性检验(F(F检验检验) ) 方程的显著性检验,旨在对模型中被解释变量与解释变量之间的线性关系在总体上能否显著成立作出推断。 1、方程显著性的F检验 即检验模型 Yi=0+1X1i+2X2i+ +kXki+i i=1,2, ,n中的参数j能否显著不为0。 可提出如下原假设与备择假设: H0: 0=1=2= =k=0 H1: j不全为0 F F检验检验的思想来自于的思想来自于总总离差平方和的分解式:离差平方和的分解式: TSS=ESS+RSS TSS=ESS+RSS 假设这个比值较大,那么X的结合体对Y的解释程度高,可以为总体存在线性关系,反之

16、总体上能够不存在线性关系。 因此,可经过该比值的大小对总体线性关系进展推断。 根据数理统计学中的知识,在原假设H0成立的条件下,统计量 服从自在度为(k , n-k-1)的F分布。 给定显著性程度,可得到临界值F(k,n-k-1),由样本求出统计量F的数值,经过 F F(k,n-k-1) 或 FF(k,n-k-1)来回绝或接受原假设H0,以断定原方程总体上的线性关系能否显著成立。 对于中国居民人均消费支出的例子: 一元模型:F=285.92 二元模型:F=2057.3给定显著性程度 =0.05,查分布表,得到临界值: 一元例:F(1,21)=4.32 二元例: F(2,19)=3.52显然有

17、F F(k,n-k-1) ,即二个模型的线性关系在95%的程度下显著成立。 2、关于拟合优度检验与方程显著性检验关系的讨论 由可推出:与或 在中国居民人均收入在中国居民人均收入消消费费一元模型中,一元模型中, 在中国居民人均收入在中国居民人均收入消消费费二元模型中,二元模型中, 三、变量的显著性检验三、变量的显著性检验t t检验检验 方程的总体线性关系显著每个解释变量对被解释变量的影响都是显著的。 因此,必需对每个解释变量进展显著性检验,以决议能否作为解释变量被保管在模型中。 这一检验是由对变量的 t 检验完成的。 1、t统计量统计量 由于 以cii表示矩阵(XX)-1 主对角线上的第i个元素

18、,于是参数估计量的方差为: 其中2为随机误差项的方差,在实践计算时,用它的估计量替代: 因此,可构造如下t统计量 2、t检验 设计原假设与备择假设: H1:i0 给定显著性程度,可得到临界值t/2(n-k-1),由样本求出统计量t的数值,经过 |t| t/2(n-k-1) 或 |t|t/2(n-k-1)来回绝或接受原假设H0,从而断定对应的解释变量能否应包括在模型中。 H0:i=0 i=1,2k 留意:一元线性回归中,留意:一元线性回归中,t t检验与检验与F F检验一致检验一致 一方面,t检验与F检验都是对一样的原假设H0:1=0 进展检验; 另一方面,两个统计量之间有如下关系: 在中国居民

19、人均收入-消费支出二元模型例中,由运用软件计算出参数的t值: 给定显著性程度=0.05,查得相应临界值: t0.025(19) =2.093。 可见,计算的一切t值都大于该临界值,所以回绝原假设。即:包括常数项在内的3个解释变量都在95%的程度下显著,都经过了变量显著性检验。四、参数的置信区间四、参数的置信区间 参参数数的的置置信信区区间间用用来来调调查查:在在一一次次抽抽样样中中所所估估计计的参数的参数值值离参数的真离参数的真实值实值有多有多“近。近。 在在变变量的量的显显著性著性检验检验中曾中曾经经知道:知道:容易推出:在容易推出:在(1-(1-) )的置信程度下的置信程度下i i的置信区

20、的置信区间间是是 其中,t/2为显著性程度为 、自在度为n-k-1的临界值。 在中国居民人均收入消费支出二元模型例中,给定=0.05,查表得临界值:t0.025(19)=2.093计算得参数的置信区间: 0 :(44.284, 197.116) 1 : (0.0937, 0.3489 ) 2 :(0.0951, 0.8080) 从回归计算中已得到:如何才干减少置信区间?如何才干减少置信区间? 增大增大样样本容量本容量n n,由于在同,由于在同样样的的样样本容量下,本容量下,n n越大,越大,t t分布表中的分布表中的临临界界值值越小,同越小,同时时,增大,增大样样本容量,本容量,还还可使可使样

21、样本参数估本参数估计计量的量的规规范差减范差减小;小; 提高模型的提高模型的拟拟合合优优度,由于度,由于样样本参数估本参数估计计量量的的规规范差与残差平方和呈正比,模型范差与残差平方和呈正比,模型优优度越高,度越高,残差平方和残差平方和应应越小。越小。提高提高样样本本观测值观测值的分散度的分散度,普通情况下,普通情况下,样样本本观测值观测值越分散,越分散,(XX)-1的分母的的分母的|XX|的的值值越大,致使区越大,致使区间间减少。减少。3.4 3.4 多元多元线线性回性回归归模型的模型的预测预测 一、一、E(Y0)E(Y0)的置信区间的置信区间 二、二、Y0Y0的置信区间的置信区间对于模型

22、给 定 样 本 以 外 的 解 释 变 量 的 观 测 值X0=(1,X10,X20,Xk0),可以得到被解释变量的预测值: 它可以是总体均值E(Y0)或个值Y0的预测。 但严厉地说,这只是被解释变量的预测值的估计值,而不是预测值。 为了进展科学预测,还需求出预测值的置信区间,包括E(Y0)和Y0的置信区间。 一、一、E(Y0)E(Y0)的置信区间的置信区间易知 容易证明 于是,得到(1-)的置信程度下E(Y0)的置信区间:其中,t/2为(1-)的置信程度下的临界值。二、二、Y0Y0的置信区间的置信区间假设曾经知道实践的预测值Y0,那么预测误差为:容易证明 e0服从正态分布,即 构造t统计量

23、可得给定(1-)的置信程度下Y0的置信区间: 中国居民人均收入中国居民人均收入- -消费支出二元模型例中:消费支出二元模型例中:20192019年人均年人均GDPGDP:4033.14033.1元,元, 于是人均居民消费的预测值为 2019=120.7+0.22134033.1+0.45151690.8=1776.8元 实测值90年价=1782.2元,相对误差:-0.31% 预测预测的置信区的置信区间间 :于是E(2019的95%的置信区间为: 或 1741.8,1811.7或 1711.1, 1842.4 同样,易得2019的95%的置信区间为3.5 3.5 回回归归模型的其他函数方式模型的

24、其他函数方式 一、模型的类型与变换一、模型的类型与变换 二、非线性回归实例二、非线性回归实例说说 明明在实践经济活动中,经济变量的关系是复杂的,直接表现为线性关系的情况并不多见。如著名的恩格尔曲线(Engle curves)表现为幂函数曲线方式、宏观经济学中的菲利普斯曲线Pillips cuves表现为双曲线方式等。但是,大部分非线性关系又可以经过一些简单的数学处置,使之化为数学上的线性关系,从而可以运用线性回归模型的实际方法。一、模型的类型与变换一、模型的类型与变换 1 1、倒数模型、多、倒数模型、多项项式模型与式模型与变变量的直接置量的直接置换换法法 例如,描画税收与税率关系的拉弗曲例如,

25、描画税收与税率关系的拉弗曲线线:抛物:抛物线线 s = a + b r + c r2 c0 s:税收;:税收; r:税率:税率设X1 = r,X2 = r2, 那么原方程变换为 s = a + b X1 + c X2 ck。 假设出现n2F(n2, n1-k-1) ,那么回绝原假设,以为预测期发生了构造变化。 例例3.6.2 中国城镇居民食品人均消费需求的邹中国城镇居民食品人均消费需求的邹氏检验。氏检验。 1、参数稳定性检验19811994:RSS1=0.003240 20192019: (9.96) (7.14) (-5.13) (1.81) 19812019: (14.83) (27.26

26、) (-3.24) (-11.17) 给定=5%,查表得临界值F0.05(4, 13)=3.18 结论结论:F值值临临界界值值,回,回绝绝参数参数稳稳定的原假定的原假设设,阐阐明中国城明中国城镇镇居民食品人均消居民食品人均消费费需求在需求在1994年前后年前后发发生了生了显显著著变变化。化。 2、邹邹氏氏预测检验预测检验给定=5%,查表得临界值F0.05(7, 10)=3.18 结论: F值临界值,回绝参数稳定的原假设 * *四、非线性约束四、非线性约束 也可对模型参数施加非线性约束,如对模型 施加非线性约束12=1,得到受约束回归模型: 该模型必需采用非线性最小二乘法nonlinear le

27、ast squares进展估计。 非线性约束检验是建立在最大似然原理根底上的,有最大似然比检验、沃尔德检验与拉格朗日乘数检验.1、最大似然比检验、最大似然比检验 (likelihood ratio test, LR) 估计:无约束回归模型与受约束回归模型, 方法:最大似然法, 检验:两个似然函数的值的差别能否“足够大。 记L(,2)为一似然函数:无约束回归 : Max:受受约约束回束回归归 : Max: : Max:约束:g()=0或求极值: g():以各约束条件为元素的列向量, :以相应拉格朗日乘数为元素的行向量 受约束的函数值不会超越无约束的函数值,但假设约束条件为真,那么两个函数值就非常

28、“接近。 由此,定义似然比likelihood ratio: 假设比值很小,阐明两似然函数值差距较大,那么应回绝约束条件为真的假设; 假设比值接近于,阐明两似然函数值很接近,应接受约束条件为真的假设。 详细检验时,由于大样本下:h是约束条件的个数。因此:经过LR统计量的2分布特性来进展判别。 在中国城镇居民人均食品消费需求例中,对零阶齐次性的检验: LR= -2(38.57-38.73)=0.32 给出=5%、查得临界值20.05(1)3.84, LR 20.05(1),不回绝原约束的假设, 结论:中国城镇居民对食品的人均消费需求函数满足零阶齐次性条件。 、沃尔德检验、沃尔德检验Wald te

29、st, W 沃尔德检验中,只须估计无约束模型。如对 在一切古典假设都成立的条件下,容易证明 因此,在1+2=1的约束条件下: 记可建立沃尔德统计量: 假设有h个约束条件,可得到h个统计量z1,z2,zh 约束条件为真时,可建立大样本下的服从自在度为h的渐近2 分布统计量: 其中,Z为以zi为元素的列向量,C是Z的方差-协方差矩阵。因此,W从总体上丈量了无约束回归不满足约束条件的程度。对非线性约束,沃尔德统计量W的算法描画要复杂得多。 3、拉格朗日乘数检验、拉格朗日乘数检验 拉格朗日乘数检验那么只需估计受约束模型. 受约束回归是求最大似然法的极值问题: 是拉格朗日乘数行向量,衡量各约束条件对最大

30、似然函数值的影响程度。 假设某一约束为真,那么该约束条件对最大似然函数值的影响很小,于是,相应的拉格朗日乘数的值应接近于零。 因此,拉格朗日乘数检验就是检验某些拉格朗日乘数的值能否“足够大,假设“足够大,那么回绝约束条件为真的假设。 拉格朗日统计量LM本身是一个关于拉格朗日乘数的复杂的函数,在各约束条件为真的情况下,服从一自在度恰为约束条件个数的渐近2分布。 同样地,假设为线性约束,LM服从一准确的2分布:(*)n为样本容量,R2为如下被称为辅助回归auxiliary regression的可决系数: 假设约束是非线性的,辅助回归方程的估计比较复杂,但仍可按*式计算LM统计量的值。 最后,普通地有:LMLRW

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号