计量经济学南开大学经济学院张伯伟课件

上传人:hs****ma 文档编号:568246806 上传时间:2024-07-23 格式:PPT 页数:68 大小:397.50KB
返回 下载 相关 举报
计量经济学南开大学经济学院张伯伟课件_第1页
第1页 / 共68页
计量经济学南开大学经济学院张伯伟课件_第2页
第2页 / 共68页
计量经济学南开大学经济学院张伯伟课件_第3页
第3页 / 共68页
计量经济学南开大学经济学院张伯伟课件_第4页
第4页 / 共68页
计量经济学南开大学经济学院张伯伟课件_第5页
第5页 / 共68页
点击查看更多>>
资源描述

《计量经济学南开大学经济学院张伯伟课件》由会员分享,可在线阅读,更多相关《计量经济学南开大学经济学院张伯伟课件(68页珍藏版)》请在金锄头文库上搜索。

1、计量经济学计量经济学 计量经济学南开大学经济学院张伯伟课件引 言一、计量经济学1、计量经济学(Econometrics) 利用数学和统计推断为工具,在经济理论指导下对经济现象进行分析,并对经济理论进行检验和发展的一门学科。 其内容涉及经济理论、数理经济、经济统计和数理统计等。2、计量经济学与经济理论 经济理论:定性 计量经济学:数值估计,检验3、计量经济学与数理经济学 数理经济学:以数学形式表述经济理论,不涉及理论的可度量性和经验方面的可论证性。 计量经济学:利用数理经济学的数学方程式,并把之改造成适合于经验检验的形式。计量经济学南开大学经济学院张伯伟课件4、计量经济学与经济统计学 经济统计:

2、经济数据的收集、加工,不利用数据来检验经济理论。 计量经济学:以经济统计数据为原始资料进行分析。5、计量经济学与数理统计 数理统计:是计量经济学的基本工具,但由于经济数据的特殊性,力量经济学需要特殊的处理方法。计量经济学南开大学经济学院张伯伟课件二、计量经济学的方法基本过程: 经济理论 理论的数学模型 理论的计量经济学模型 数据的收集整理 计量经济模型的参数估计 假设检验 预报和预测 控制或政策制定计量经济学南开大学经济学院张伯伟课件例:例:检验凯恩斯关于边际消费倾向理论,或利用该理论进行经济控制或经济政策制定。理论 人们的消费支出随收入的增加而增加,但消费支出的增加小于收入的增加。即边际消费

3、倾向MPC大于零而小于1。(定性)建立数学模型 假定消费支出Y与收入X之间有如下关系:其中,Y为消费支出,X为收入,a和b为模型参数。B就是MPC。 这里Y为因变量,X为自变量/解释变量。假定两者之间存在先行关系。 (在不同情况下,数学模型的形式不一样,也可能是多个方程连立,有多个解释变量)计量经济学南开大学经济学院张伯伟课件建立计量经济学模型 由于经济变量之间的关系不是确定的(以函数形式准确表达),必须修改数理模型,建立计量模型: u为误差项,代表了影响变量间非确定关系的其他因素的影响。这是一个线性回归模型。OXY斜率为b数理模型OXY斜率为b计量模型aa计量经济学南开大学经济学院张伯伟课件

4、数据的收集整理 如果1980分析一国的消费情况,要收集该国的总消费支出数据和总收入数据。年份年份Y YX X年份年份Y YX X19801980244724473776377619861986296929694405440519811981247724773843384319871987305230524540454019821982250425043760376019881988316231624719471919831983261926193907390719891989322332234838483819841984274627464149414919901990326032604878

5、4878198519852866286642804280199119913240324048214821 (选择、加工)美国1980-1991年个人消费支出与GDP(10亿美元,1987年不变价格)计量经济学南开大学经济学院张伯伟课件计量经济模型的参数估计 采用回归技术,利用统计数据估计出参数a和b的经验值。 根据估计结果,美国1980-1991年的MPC约为0.72。假设检验 以一定的标准,对参数的估计结果进行检验。如果在统计意义上,b小于1,说明结果是可接受的。预报和预测 如果计量模型可以接受,就可用来对因变量进行预测。假定1994年,美国的GDP预计为6万亿美元,则该年的消费支出预计为计

6、量经济学南开大学经济学院张伯伟课件控制或政策制定 如果希望1994年的消费支出达到4万亿美元,则政府必须通过政策来保证收入水平为:三、计量经济学的内容 可分为理论和应用两大类。 理论计量经济学:研究适当的方法,来测度有计量经济模型设定的经济关系式。应用计量经济学:以理论计量经济学为工具,研究经济学或商业中的各领域。计量经济学南开大学经济学院张伯伟课件四、计量经济学的应用软件包 有很多种。常用的有:TSP、SPSS、SAS等。计量经济学南开大学经济学院张伯伟课件第一章 回归分析一、回归分析 分析因变量与解释变量之间的统计依赖关系,目的在于通过后者的已知或设定值去估计或预测前者的均值。假定一个国家

7、的所有家庭的收入(X)和消费支出(Y)统计如下,希望知道家庭消费支出与家庭收入之间的关系:Y=F(X)。 X XY Y8080100100120120140140160160180180200200220220240240260260555565657979808010210211011012012013513513713715015060607070848493931071071151151361361371371451451521526565747490909595110110120120140140140140155155175175707080809494103103116116130

8、1301441441521521651651781787575858598981081081181181351351451451571571751751801808888113113125125140140160160189189185185115115162162191191户数户数5 56 65 57 76 66 65 57 76 65 5总支出总支出3253254624624454457077076786787507506856851043104396696612111211计量经济学南开大学经济学院张伯伟课件YX55100 120140 16080 根据每个家庭的收入和支出绘出散点图,

9、大致可看出二者间的关系:在统计意义上,二者成正比。 由对全体居民的收入和支出的调查结果,我们知道处于不同收入阶层的居民有一个平均的支出水平,这一支出水平与收入大致呈线性关系。 图中的这条通过各收入阶层平均支出额的直线,描述了这一依赖关系。我们把这条线称为回归线。计量经济学南开大学经济学院张伯伟课件二、统计关系与确定关系 在回归分析中,得到因变量与自变量之间的依赖关系是统计依赖关系,而不是确定关系或函数关系。三、回归与因果关系 回归分析得到的变量间的统计依赖关系,统计关系式自身不代表任何确定的因果关系。四、计量经济分析使用的数据 有三类。 (1)时间序列数据。一个时间序列是对一个变量在不同时间取

10、的一组观测结果。这些数据可以按固定的时间间隔收集。 收集的数据可以是定量的,也可以是定性的(虚拟变量)。 中国1993年1998年的GDP增长率 (%)19931993 19941994 19951995 19961996 19971997 1998199814.214.213.513.510.510.59.69.68.88.87.87.8计量经济学南开大学经济学院张伯伟课件(2)横截面数据。一个或多个变量在同一时点上收集的数据。 1992年实际GDP增长(3)混合数据。国家和国家和地区地区 实际实际GDPGDP增长率增长率 19921992年年19931993年年19941994年年1995

11、1995年年19961996年年19971997年年19981998年年加拿大加拿大0.90.92.52.53.93.92.22.21.21.24.04.03.13.1智利智利12.312.37.07.05.75.710.610.67.47.47.17.13.43.4墨西哥墨西哥3.63.62.02.04.44.4-6.2-6.25.25.27.07.04.84.8秘鲁秘鲁-1.7-1.76.46.413.113.17.47.42.52.56.96.90.30.3美国美国2.72.72.32.33.53.52.02.02.82.83.93.93.93.9中国中国14.214.213.513.5

12、12.612.610.510.59.69.68.88.87.87.8香港香港6.36.36.16.15.45.43.93.94.64.65.35.3-5.1-5.1日本日本1.01.00.30.30.60.61.51.53.93.91.41.4-2.8-2.8国家国家/ /地地区区加拿大加拿大智利智利墨西哥墨西哥秘鲁秘鲁美国美国中国中国香港香港日本日本GDPGDP0.90.912.312.33.63.6-1.7-1.72.72.714.214.26.36.31 1计量经济学南开大学经济学院张伯伟课件第二章 双变量回归分析第一节 经典正态线性回归模型(CNLRM) 一、基本概念 以下表为例。 X

13、 XY Y8080100100120120140140160160180180200200220220240240260260555565657979808010210211011012012013513513713715015060607070848493931071071151151361361371371451451521526565747490909595110110120120140140140140155155175175707080809494103103116116130130144144152152165165178178757585859898108108118118135

14、1351451451571571751751801808888113113125125140140160160189189185185115115162162191191户数户数5 56 65 57 76 66 65 57 76 65 5总支出总支出3253254624624454457077076786787507506856851043104396696612111211计量经济学南开大学经济学院张伯伟课件1、几个概念条件分布(Conditional distribution):以X取定值为条件的Y的条件分布条件概率(Conditional probability):给定X的Y的概率,记为

15、P(Y|X)。例如,P(Y=55|X=80)=1/5;P(Y=150|X=260)=1/7。(表)条件期望(conditional Expectation):给定X的Y的期望值,记为E(Y|X)。例如,E(Y|X=80)=551/5601/5651/5701/5751/565总体回归曲线(Popular Regression Curve)(总体回归曲线的几何意义):当解释变量给定值时因变量的条件期望值的轨迹。2、总体回归函数( Popular Regression Function,PRFE(Y|Xi)=f(Xi)当PRF的函数形式为线性函数,则有,E(Y|Xi)=1+2Xi其中1和2为未知而

16、固定的参数,称为回归系数。1和2也分别称为截距和斜率系数。上述方程也称为线性总体回归函数。3、“线性”的含义 “线性”可作两种解释:对变量为线性,对参数为线性。一般“线性回归”一词总是指对参数为线性的一种回归(即参数只以它的1次方出现)。 计量经济学南开大学经济学院张伯伟课件4、PRF的随机设定 将个别的Yi围绕其期望值的离差(Deviation)表述如下: ui=Yi-E(Y|Xi) 或 Yi=E(Y|Xi)+ui其中ui为随机误差项(Stochastic error)或随机干扰项(Stochastic disturbance)。线性总体回归函数: PRF:Yi=1+2Xi+ui=E(Y|X

17、i)+ui5、随机干扰项的意义 随机扰动项是从模型中省略下来的而又集体地影响着Y的全部变量的替代物。显然的问题是:为什么不把这些变量明显地引进到模型中来,而以随即扰动项来替代?理由是多方面的:(1)理论的含糊性:理论不能完全说明影响因变量的所有影响因素。(2)数据的欠缺:无法获得有关数据。(3)核心变量与周边变量:希望能找到与有较大影响的核心变量的关系。(4)内在随机性:因变量具有内在的随机性。(5)替代变量:用来代替不可观测变量的替代变量选择,造成一定误差。(6)省略原则:研究中尽可能使回归式简单。(7)错误的函数形式:回归式的的选择是主观的。计量经济学南开大学经济学院张伯伟课件6、样本回归

18、函数(SRF) 由于在大多数情况下,我们只知道变量值得一个样本,要用样本信息的基础上估计PRF。(表) X X(收入)(收入)8080100100120120140140160160180180200200220220240240260260Y Y(支出)(支出)5555656579798080102102110110120120135135137137150150样本1 X X(收入)(收入)8080100100120120140140160160180180200200220220240240260260Y Y(支出)(支出)70708080949410310311611613013014

19、4144152152165165178178样本2样本回归函数SRF: 在回归分析中,我们用SRF估计PRF。计量经济学南开大学经济学院张伯伟课件 估计量(Estimator):一个估计量又称统计量(statistic),是指一个规则、公式或方法,以用来根据已知的样本所提供的信息去估计总体参数。在应用中,由估计量算出的数值称为估计(值)(estimate)。样本回归函数SRF的随机形式为:其中 表示(样本)残差项(residual)。 Xi X PRF:E(Y|Xi)=1+2XiSRF:YE(Y|Xi) SRF是PRF的近似估计。 为了使二者更为接近,即要使计量经济学南开大学经济学院张伯伟课件

20、二、经典线性回归模型(CLRM)的基本假定 假定1:回归模型对参数是线性的假定2:在重复抽样中X的值是固定的(非随机) 假定3:干扰项的均值为零。即,E(ui|Xi)=0假定4:同方差性或ui的方差相等。即Var(ui|Xi)=Eui-E(ui)|Xi2 =E(ui2|Xi2 = 2假定5:各个干扰项无自相关。即Cov(ui,uj|Xi,Xj)=Eui-E(ui|Xi) uj-E(uj|Xj) =E(ui|Xi)(uj|Xj) = 0假定6:ui和Xi的协方差为零。即Cov(ui,Xi) = Eui E(ui) Xi E(Xi) = Eui (Xi E(Xi) =E(ui Xi) E(ui)E

21、(Xi) = E(ui Xi) = 0假定7:观测次数必须大于待估计的参数个数。假定8:解释变量X的只要有变异性。即一个样本中,Xi不能完全相同。假定9:模型没有设定误差。假定10:没有完全的多重共线性,即解释变量之间没有完全的线性关系。计量经济学南开大学经济学院张伯伟课件第二节 双变量回归模型:估计 一、普通最小二乘法(Ordinary Least Squares,OLS) 基本思路:用样本回归函数估计总体回归函数。以估计估计出的参数使残差的平方和最小。时,真实值计量经济学南开大学经济学院张伯伟课件求解这一最小化问题,根据最大化的一阶条件:计量经济学南开大学经济学院张伯伟课件可得到以下正规方

22、程(Normal equation) :二、参数的估计(点估计):OLS估计量 1、解上述正规方程组得到估计值: 解出,可得到估计值。称为最小二乘估计量(OLS估计)。计量经济学南开大学经济学院张伯伟课件2、 OLS样本回归线的性质: 计量经济学南开大学经济学院张伯伟课件三、2 的估计 真实方差的估计量:四、OLS估计的精度或标准误差 由于OLS估计是根据一个样本得到的,需要检验估计量的可靠性(reliability)或精密度。在统计学中,一个估计量的精密度由它的标准误(standard error, se)来衡量。计量经济学南开大学经济学院张伯伟课件计量经济学南开大学经济学院张伯伟课件五、O

23、LS 统计量的性质:高斯- 马尔柯夫定理 在CLRM假定下,在所有线性无偏估计量中,OLS估计量有最小方差,即OLS是BLUE(Best Linear Unbiased Estimator)。 (1)线性: 为Yi的线性函数计量经济学南开大学经济学院张伯伟课件 (2)无偏性: 为的无偏估计量。计量经济学南开大学经济学院张伯伟课件 (3)最小方差性: OLS估计量 在所有线性无偏估计量中,具有最小方差。即 可以证明OLS估计量具有最小方差。计量经济学南开大学经济学院张伯伟课件第三节 拟合优度检验 拟合优度检验是指对样本回归线与样本观测值之间拟合程度的检验。度量拟合程度的指标是判定系数R2 。 基

24、本思路:因变量Y的变异,能够被X的变异解释的比例越大,则OLS回归线对总体的解释程度就越好。 Xi X PRFSRFY总平方和(TSS):实测的Y值围绕其均值的总变异 :计量经济学南开大学经济学院张伯伟课件定义判定系数R2:估计的Y值围绕其均值的总变异 未被解释的围绕回归线的Y值的变异 计量经济学南开大学经济学院张伯伟课件 R2 测度了在Y的总变异中,由回归模型解释的部分所占的比例。 R2 越高,回归模型拟合的程度就越好。 R2 的性质: (1)非负。(2)0R2 1其它表达方式:计量经济学南开大学经济学院张伯伟课件判定系数与相关系数的关系:判定系数与相关系数的关系: 相关系数:表示两个随机变

25、量之间的相关程度。定义为: 以样本方差和样本协方差估计X、Y的方差和协方差,样本相关系数为: 样本相关系数的平方与判定系数相等,但二者的意义不同。计量经济学南开大学经济学院张伯伟课件第四节 区间估计 为了判断点估计与真值的接近程度,可以通过构造以估计值为中心的一个区间(随机的),以该区间包括了真值的概率来确定估计值接近真值的把握程度:一、 的置信区间计量经济学南开大学经济学院张伯伟课件由于未知,以其估计值代替,-t/2t/2o/2/2 给定置信系数100(1-)%,随机的置信区间将有100(1-)%包含真值2。二、 的置信区间计量经济学南开大学经济学院张伯伟课件三、 的置信区间计量经济学南开大

26、学经济学院张伯伟课件第五节 OLS估计量的显著性检验 根据样本回归得到的总体参数的估计量,随着选取样本的不同观测值而不同;给定样本观测值时,得到的参数也与总体参数的真值不同。因此,必须对估计的参数值是否显著成立,做统计检验,即显著性检验。一、 的显著性检验原假设 H0:2 = 0备择假设 H1: 2 0-t/2t/2o/2/2计量经济学南开大学经济学院张伯伟课件原假设 H0:2 = 2*备择假设 H1: 2 2*对于: 如果有理由认为2不能小于零(不能大于零),则在2倍t法则计量经济学南开大学经济学院张伯伟课件二、 的显著性检验原假设 H0:1 = 0备择假设 H1: 1 0三、回归方程的的显

27、著性检验:F 检验 从方差分析(analysis of variance, ANOVA)的角度,检验回归方程的显著性。 根据总离查平方和的分解式:TSS = ESS + RSS,计量经济学南开大学经济学院张伯伟课件 总离差(TSS)的自由度为(n-1),回归平方和(ESS)的自由度为1,残差平方和(RSS)的自由度为(n-2)。 定义均方差 = 平方和 / 自由度,方差分析表(ANOVA / AOV表)为:离差名称离差名称平方和平方和自由度自由度均方差均方差ESSESS1 1RSSRSSn-2n-2TSSTSSn-1n-1双变量回归模型ANOVA表 样本决定系数 R2 能够说明样本的拟和优度。

28、但是我们还需要对总体做出推断,检验总体的线性是否成立。 思路:若ESS / RSS 比较大,则X对Y的解释程度就比较高,可以推测总体存在线性。但是ESS / RSS 样本不同而不同,对于给定的样本,利用ESS / RSS 对总体进行推断,必须进行统计检验。计量经济学南开大学经济学院张伯伟课件原假设 H0:2 = 0备择假设 H1: 2 0 若H0成立,说明回归方程无显著意义,总体不存在线性;若拒绝H0,则可认为回归方程显著成立,总体存在线性。因此,定义统计量计量经济学南开大学经济学院张伯伟课件第六节 利用回归方程预测 根据经济理论建立线性回归模型,并利用统计资料对模型参数进行了估计,建立了回归

29、方程。经过显著性检验,判定回归方程能正确反映经济现象时,一个重要目标就是利用回归方程进行预测。一、均值预测已知X的一个特定值X0,要预测Y0的条件均值(总体回归线上的对应Y值)E(Y|X0),计量经济学南开大学经济学院张伯伟课件 显然,当X0越接近X 的均值,区间就变得越狭窄。计量经济学南开大学经济学院张伯伟课件二、个值预测 预测给定X的值X0,对应的Y0, 仍为BLUE)。计量经济学南开大学经济学院张伯伟课件小结:双变量线性回归分析的主要步骤小结:双变量线性回归分析的主要步骤1、建立回归模型 研究某一经济现象,先根据经济理论,选择具有因果关系的两个变量(Y,X),建立线性回归模型,确定解释变

30、量和被解释变量。 如果不明确两个变量是否为线性关系,也可以根据散点图来分析。 建立回归模型可以是根据经济理论,也可以根据相同或相似经济现象的历史分析经验来建立回归模型。 建立模型时,不仅要考虑理论或经验的依据,同时也要考虑数据的可利用程度。2、收集数据,并经过适当的加工整理,得到适于回归分析的样本数据集。3、估计模型参数。利用样本数据,以OLS得到模型参数的估计值。4、对回归模型和参数估计值进行检验。 检验回归结果是否正确反映经济现象,是否与理论相符。包括理论检验和统计检验。 经济理论检验:参数的符号,大小是否与理论和实际相符。若不符,寻找原因(数据?模型设定?理论错误?) 统计检验:拟和优度

31、检验,估计量、回归方程的显著性检验。计量经济学南开大学经济学院张伯伟课件5、预测 对于解释变量的特定值,带入回归方程得到因变量的预测值;在给定的置信水平上,得到因变量预测值的置信区间。6、回归结果的表述: 并说明参数的显著水平( )。计量经济学南开大学经济学院张伯伟课件以回归分析为工具的实证分析文章的结构以回归分析为工具的实证分析文章的结构一、研究的来源和基础 对研究的经济现象的描述;研究该现象的意义;相同或相似的代表性研究的方法、结论,并作总结评价;本研究的出发点;文章的结构介绍。 二、理论分析 选择合适的经济理论,利用理论对要研究的经济想象做定性分析,得到大致的结果;建立理论模型。三、建立

32、回归模型 根据理论模型,建立合理、可分析的回归模型。回归模型的形式、解释变量的个数和选择,不一定与数理模型完全相同。四、对所使用的数据做出说明 数据的来源;数据加工的原因和处理方式;替代数据的说明等。五、回归结果及对结果的分析 列出回归的结果(包括参数的估计值和统计检验结果);结合理论分析回归结果六、结论/总结/应用计量经济学南开大学经济学院张伯伟课件 X X(收入)(收入)Y Y(支出)(支出)8080100100120120140140160160180180200200220220240240260260555565657979808010210211011012012013513513

33、7137150150606070708484939310710711511513613613713714514515215265657474909095951101101201201401401401401551551751757070808094941031031161161301301441441521521651651781787575858598981081081181181351351451451571571751751801808888113113125125140140160160189189185185115115162162191191户数户数5 56 65 57 76 66

34、 65 57 76 65 5既定收入下,每户既定收入下,每户支出为表中数额的支出为表中数额的概率概率1/51/51/61/61/51/51/71/71/61/61/61/61/51/51/71/71/61/61/51/5计量经济学南开大学经济学院张伯伟课件第三章 多变量回归分析第一节 多变量线性回归模型一、多变量线性回归模型的PRF 如果假定对因变量Y 有k-1个解释变量:X2,X3,Xk,k 变量总体回归函数为:其中1为常数项, 2 2 为解释变量X2 Xk 的系数,u为随机干扰项。 总体回归函数PRF给出的是给定解释变量X2 Xk 的值时,Y的期望值:E ( Y | X2,X3,Xk )。

35、 假定有n组观测值,则可写成矩阵形式:计量经济学南开大学经济学院张伯伟课件 二、多 变量线性回归模型的基本假定 随机干扰项的期望值为0。同方差性;无序列相关。计量经济学南开大学经济学院张伯伟课件无多重共线性,即Xi (i = 2,3, ,k )之间不存在线性关系:随机干扰项服从正态分布。三、多 变量线性回归模型的SRF计量经济学南开大学经济学院张伯伟课件 根据残差的平方和最小化的原理,解出参数的估计量。第二节 多变量回归模型的OLS估计一、参数估计 可得到如下正规方程组:计量经济学南开大学经济学院张伯伟课件计量经济学南开大学经济学院张伯伟课件如果直接用矩阵微分,则二、 的估计量 三、 的方差-

36、协方差矩阵 计量经济学南开大学经济学院张伯伟课件计量经济学南开大学经济学院张伯伟课件四、OLS估计量 的性质:计量经济学南开大学经济学院张伯伟课件第三节 拟合优度检验:一、判定系数R2:平方和平方和dfdf均方差均方差ESSESSk-1k-1RSSRSSn-kn-kTSSTSSn-1n-1方差分析表( ANOVA)计量经济学南开大学经济学院张伯伟课件二、校正的R2 : 由R2的计算式可看出, R2 随解释变量的增加而可能提高(不可能降低): 与解释变量X的个数无关,而 则可能随着解释变量的增加而减少(至少不会下降),因而,不同的SRF,得到的R2 就可能不同。必须消除这种因素,使R2 即能说明

37、被解释的离差与总离差之间的关系,又能说明自由度的数目。定义校正的样本决定系数 :计量经济学南开大学经济学院张伯伟课件三、R2 与 的性质第四节 显著性检验 一、单参数的显著性检验: 如果接受H0 ,则变量Xi 对因变量没有影响,而接受H1,则说明变量Xi 对因变量有显著影响。 检验 的显著性, 即在一定显著水平下, 是否显著不为0。计量经济学南开大学经济学院张伯伟课件检验步骤:如果根据理论或常识, 非负,则可做单侧检验,比较 t 与t。二、回归的总显著性检验: 检验回归系数全部为零的可能性。计量经济学南开大学经济学院张伯伟课件平方和平方和dfdf均方差均方差ESSESSk-1k-1RSSRSS

38、n-kn-kTSSTSSn-1n-1方差分析表( ANOVA) 显然,R2 越大,F越大,当R2 =1时,F无限大。 选择显著水平 ,计算F统计量的值,与F分布表中的临界值进行比较:计量经济学南开大学经济学院张伯伟课件第五节 解释变量的选择 在回归模型中的解释变量,除非由明确的理论指导或其他原因,在选择上具有一定的主观性,如何正确选择解释变量是非常重要的。一、解释变量的边际贡献分析 在建立回归模型时,假定我们顺序引入变量。在建立了Y与X2的回归模型,并进行回归分析后,再加入X2。考虑加入的变量X2是否有贡献:能否再加入后显著提高回归的解释程度ESS或决定系数R2。ESS提高的量称为变量X2的边

39、际贡献。 决定一个变量是否引入回归模型,就要先研究它的边际贡献,以正确地建立模型。如果变量的边际贡献较小,说明改变量没有必要加入模型。 分析变量的编辑贡献,可以使用方差分析表为工具,根据变量引入前、后的RSS的变化量及其显著性检验(扣除原来引入模型的解释变量的贡献),确定该变量的边际贡献是否显著。 一个简单的检验方法,就是对引入新变量后的RSS增量与新的ESS的比值做显著性检验。计量经济学南开大学经济学院张伯伟课件 可以利用方差分析表来进行分析。 设ESS为引入变量前的回归平方和,ESS 为引入m个新变量后,得到的回归平方和,RSS为引入变量后的残差平方和。 ANOVA表如下:平方和平方和自由

40、度自由度均方差均方差引入变量前的引入变量前的ESSESSU U1 1k-1k-1U U1 1/(k-1)/(k-1)引入变量后的引入变量后的ESSESSU U2 2k+m-1k+m-1U U2 2/(k+m-1)/(k+m-1)添加变量的边际贡献添加变量的边际贡献(U(U2 2-U-U1 1) )mm(U(U2 2-U-U1 1)/m)/m添加变量后的添加变量后的RSSRSSQ Qn-(k+m)n-(k+m)Q/( n-k-m)Q/( n-k-m)TSSTSSn-1n-1计量经济学南开大学经济学院张伯伟课件 在新引入变量的系数为0的原假设下,把计算出的该统计量的值与 显著水平下的临界值进行比较

41、: 引入的新变量的边际贡献显著,则应该把这些变量纳入回归模型,否则这些变量不应引入回归模型做解释变量。二、逐步回归法 如果根据理论,因变量Y与k-1个变量X2,X2,Xk 有因果关系,我们要建立的回归模型要在这些变量中选择正确的解释变量,要根据变量的边际贡献大小,把贡献大的变量纳入回归模型。分析边际贡献并选择变量的过程,实际上是一个逐步回归的过程。 首先,分别建立Y与k-1个变量X2,X2,Xk 的回归模型:计量经济学南开大学经济学院张伯伟课件回归后,得到各回归方程的平方和 选择其中ESS最大并通过F检验的变量作为首选解释变量,假定是X2 。此时可确定一个基本的回归方程: 在此基础上进行第二次

42、回归,在剩下的变量中寻找最佳的变量:建立k 2 个回归方程:计量经济学南开大学经济学院张伯伟课件回归后,得到各回归方程的平方和: 同样,选择其中ESS最大并通过F检验的变量作为新增解释变量,假定是X3 。此时可确定一个基本的回归方程: 重复这一过程,直到所有变量中,边际贡献显著的变量全部引入回归模型中为止,得到最终的回归式: 也可以采用逐步减少边际贡献不显著的变量的方式,逐步回归确定回归模型包括的变量,方法一样。计量经济学南开大学经济学院张伯伟课件第六节 利用多元回归模型进行预测 对于多元回归模型:通过回归分析,得到回归方程后,就可根据给定的解释变量的一组值X0 =(1,X20,X30, Xk0),对因变量Y的值进行估计。一、个值预测为Y0及 的预测值。计量经济学南开大学经济学院张伯伟课件二、区间预测计量经济学南开大学经济学院张伯伟课件

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学/培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号