《计量经济学PPT精选文档》由会员分享,可在线阅读,更多相关《计量经济学PPT精选文档(590页珍藏版)》请在金锄头文库上搜索。
1、计量经济学计量经济学Econometrics主讲教师:刘开华主讲教师:刘开华经济与工商管理学院经济与工商管理学院2013年1月1第一章第一章 导论导论2013年1月2课程说明课程说明n教学目的教学目的1、掌握基本的理论与方法、掌握基本的理论与方法2、能够建立实用的计量经济学应用模型、能够建立实用的计量经济学应用模型n先修课程先修课程微观经济学、宏观经济学、统计学、高等数学、微观经济学、宏观经济学、统计学、高等数学、线性代数、概率论与数理统计线性代数、概率论与数理统计教材和参考书教材和参考书n教材:教材:n计量经济学,李子奈,高等教育出版社,计量经济学,李子奈,高等教育出版社,2008年年n参考
2、书参考书n计量经济学,庞皓,科学出版社,计量经济学,庞皓,科学出版社,2007年年n经济计量学精要,达莫达尔经济计量学精要,达莫达尔.古亚拉提,张古亚拉提,张涛等译,机械工业出版社,涛等译,机械工业出版社,2000年年n金融计量学,汪昌云,中国人民大学出版社,金融计量学,汪昌云,中国人民大学出版社,2011年年平时成绩评定平时成绩评定(30分分)n1、考勤,缺席、考勤,缺席1次扣次扣5分分n2、平时作业、平时作业n3、课题表现、课题表现(积极提问和回答问题积极提问和回答问题)一、计量经济学一、计量经济学n定义:计量经济学是将经济学、统计学和数学三定义:计量经济学是将经济学、统计学和数学三者结合
3、分析经济生活的数量关系。者结合分析经济生活的数量关系。n“统计学、经济理论和数学这三者对于真正了解统计学、经济理论和数学这三者对于真正了解现代经济生活的数量关系来说,都是必要的,但现代经济生活的数量关系来说,都是必要的,但本身并非是充分条件。三者结合起来,就是力量,本身并非是充分条件。三者结合起来,就是力量,这种结合便构成了计量经济学这种结合便构成了计量经济学”。弗里希弗里希计量经济学的产生与发展计量经济学的产生与发展n产生产生:经济学的一个分支学科:经济学的一个分支学科1926年挪威经济学家年挪威经济学家R.Frish提出提出Econometrics1930年成立世界计量经济学会年成立世界计
4、量经济学会1933年创刊年创刊Econometrican发展:发展:20世纪世纪40、50年代的大发展和年代的大发展和60年代的扩张年代的扩张20世纪世纪70年代以来非经典(现代)计量经济学年代以来非经典(现代)计量经济学的发展的发展二、学习本门课的必要性二、学习本门课的必要性(P6)课程性质:经济类专业的一门核心课程课程性质:经济类专业的一门核心课程 经济类专业核心课程共经济类专业核心课程共8 8门:政治经济学、西方经济学、计量经济学、门:政治经济学、西方经济学、计量经济学、国际经济学、货币银行学、财政学、会计学、统计学国际经济学、货币银行学、财政学、会计学、统计学现代经济学是计量经济学的时
5、代现代经济学是计量经济学的时代萨缪尔森萨缪尔森诺贝尔经济学奖得主多计量经济学相关诺贝尔经济学奖得主多计量经济学相关 诺贝尔经济学奖与计量经济学诺贝尔经济学奖与计量经济学 P6n50余位获奖者中余位获奖者中10位直接因为对计量经济学发展的贡献位直接因为对计量经济学发展的贡献而获奖而获奖n1969R.FrishJ.Tinbergenn1973W.Leotiefn1980L.R.Kleinn1984R.Stonen1989T.Haavelmon2000J.J.HeckmanD.L.McFaddenn2003R.F.EngleC.W.J.Grangern近近20位担任过世界计量经济学会会长位担任过世界
6、计量经济学会会长n30余位左右在获奖成果中应用了计量经济学余位左右在获奖成果中应用了计量经济学在经济学科中占据极重要的地位n克莱因(克莱因(R.Klein):):“计量经济学已经在经济学计量经济学已经在经济学科中居于最重要的地位科中居于最重要的地位”,“在大多数大学和学院在大多数大学和学院中,计量经济学的讲授已经成为经济学课程表中中,计量经济学的讲授已经成为经济学课程表中最有权威的一部分最有权威的一部分”。n萨缪尔森(萨缪尔森(P.Samuelson):“第二次大战后第二次大战后的经济学是计量经济学的时代的经济学是计量经济学的时代”。n获奖者名单2003RobertF.Engle,CliveW
7、.J.Granger2002DanielKahneman,VernonL.Smith2001GeorgeA.Akerlof,A.MichaelSpence,JosephE.Stiglitz2000JamesJHeckman,DanielLMcFadden1999RobertA.Mundell1998AmartyaSen1997RobertC.Merton,MyronS.Scholes1996JamesA.Mirrlees,WilliamVickrey1995RobertE.LucasJr.1994JohnC.Harsanyi,JohnF.NashJr.,ReinhardSelten1993Ro
8、bertW.Fogel,DouglassC.North1992GaryS.Becker1991RonaldH.Coase1990HarryM.Markowitz,MertonH.Miller,WilliamF.Sharpe1989TrygveHaavelmo1988MauriceAllais1987RobertM.Solow1986JamesM.BuchananJr.1985FrancoModigliani1984RichardStone1983GerardDebreu1982GeorgeJ.Stigler1981JamesTobin1980LawrenceR.Klein1979Theodor
9、eW.Schultz,SirArthurLewis1978HerbertA.Simon1977BertilOhlin,JamesE.Meade1976MiltonFriedman1975LeonidVitaliyevichKantorovichTjallingC.Koopmans1974GunnarMyrdalFriedrichAugustvonHayek1973WassilyLeontief1972JohnR.Hicks,KennethJ.Arrow1971SimonKuznets1970PaulA.Samuelson1969RagnarFrisch,JanTinbergenTheBanko
10、fSwedenPrizeinEconomicSciencesinMemoryofAlfredNobel1969forhavingdevelopedandapplieddynamicmodelsfortheanalysisofeconomicprocessesRagnarFrischNorwayJanTinbergentheetherlandsTheBankofSwedenPrizeinEconomicSciencesinMemoryofAlfredNobel1973forthedevelopmentoftheinput-outputmethodandforitsapplicationtoimp
11、ortanteconomicproblemsWassilyLeontiefUSATheBankofSwedenPrizeinEconomicSciencesinMemoryofAlfredNobel1980forthecreationofeconometricmodelsandtheapplicationtotheanalysisofeconomicfluctuationsandeconomicpoliciesLawrenceR.KleinUSATheBankofSwedenPrizeinEconomicSciencesinMemoryofAlfredNobel1984forhavingmad
12、efundamentalcontributionstothedevelopmentofsystemsofnationalaccountsandhencegreatlyimprovedthebasisforempiricaleconomicanalysisRichardStoneGreatBritainTheBankofSwedenPrizeinEconomicSciencesinMemoryofAlfredNobel1989forhisclarificationoftheprobabilitytheoryfoundationsofeconometricsandhisanalysesofsimu
13、ltaneouseconomicstructuresTrygveHaavelmoNorway计量经济学模型计量经济学模型n1、经济理论分析、经济理论分析(行为分析,影响因素分析行为分析,影响因素分析)n2、数理分析、数理分析(建立数学方程或模型建立数学方程或模型)n3、数量分析、数量分析(揭示变量间相互关系,检验理论揭示变量间相互关系,检验理论)n计量经济学模型的一般形式计量经济学模型的一般形式例如:例如:Q是产出,是产出,K是资本,是资本,L是劳动,是劳动,T是技术,是技术,u是随机项是随机项三、建立计量经济学模型的步骤和要点三、建立计量经济学模型的步骤和要点nP9P9(一)理论模型的建立(
14、一)理论模型的建立n1、确定模型包含的变量确定模型包含的变量n根据经济学理论和经济行为分析。根据经济学理论和经济行为分析。例如:同样是生产方程,电力工业和纺织工业应例如:同样是生产方程,电力工业和纺织工业应该选择不同的变量,为什么?该选择不同的变量,为什么?n考虑数据的可得性。考虑数据的可得性。 注意因素和变量之间的联系与区别。注意因素和变量之间的联系与区别。n考虑入选变量之间的关系。考虑入选变量之间的关系。 要求变量间互相独立。要求变量间互相独立。n在时间序列数据样本下可以应用在时间序列数据样本下可以应用Grange统计检统计检验等方法。验等方法。n例如,消费和例如,消费和GDP之间的因果关
15、系。之间的因果关系。Grange统计检验统计检验nFilenewworkfiledata-ragularannualstart输输入入1990end输入输入2001oknObjectnewobjectseriesnameforobject输入输入GDPoknObjectnewobjectseriesnameforobject输入输入M2okn双击双击GDP单击单击edit+/-输入数据输入数据n双击双击M2单击单击edit+/-输入数据输入数据filesave输入文件输入文件名名n单因素方程:单因素方程:fileopen文件名文件名quickestimateequation在空格中输入在空格中
16、输入GDPCM2method选择选择LS(最小二乘法最小二乘法)nGrange格朗格因果检验:格朗格因果检验:QuickGroupstatisticsGrangerCausalityTestgdpm2n2、确定模型的数学形式、确定模型的数学形式应用经济学和数理经济学的成果应用经济学和数理经济学的成果根据样本数据作出的变量关系图根据样本数据作出的变量关系图选择可能的形式模拟选择可能的形式模拟n3、拟定模型中待估计参数的理论期望值区间、拟定模型中待估计参数的理论期望值区间 符号、大小、符号、大小、 关系关系n例如:人均食品需求量例如:人均食品需求量=+(人均收入人均收入)+(食品价格食品价格)+(
17、其它商品价格其它商品价格)+n试确定试确定、的符号、大小、的符号、大小、关系关系(二)样本数据的收集(二)样本数据的收集n1、几类常用的样本数据、几类常用的样本数据n时间序列数据时间序列数据改革开放前后改革开放前后GDP和进出口贸易数据和进出口贸易数据直辖前后重庆直辖前后重庆GDP增长率变动增长率变动股市是否随时间周期变动?股市是否随时间周期变动?n截面数据截面数据西部大开发成效,东西部省份经济增长率情况西部大开发成效,东西部省份经济增长率情况地区收入越高的省份,收入差距越大?地区收入越高的省份,收入差距越大?n虚拟变量数据虚拟变量数据(离散数据离散数据)n面板数据面板数据n2、数据质量、数据
18、质量n完整性完整性n准确性准确性n可比性可比性n一致性一致性Eviews软件的数据输入软件的数据输入n1、建立一个新文件:、建立一个新文件:filen2、建立一组新序列:、建立一组新序列:objectn3、输入数据:、输入数据:editnDefault:缺省的,默认的:缺省的,默认的nChange%:增长率:增长率(三)模型参数的估计(三)模型参数的估计n1、各种模型参数估计方法、各种模型参数估计方法n2、如何选择模型参数估计方法、如何选择模型参数估计方法n3、关于应用软件的使用、关于应用软件的使用n课堂教学结合课堂教学结合Eviews,能够熟练使用一种能够熟练使用一种(四)模型的检验(四)模
19、型的检验n1、经济意义检验、经济意义检验根据拟定的符号、大小、关系进行检验根据拟定的符号、大小、关系进行检验n例如检验以下结果是否正确:例如检验以下结果是否正确:n人均食品需求量人均食品需求量=2.00.5(人均收入人均收入)4.5(食食品价格品价格)+0.8(其它商品价格其它商品价格)n思考:收入差距的影响因素?思考:收入差距的影响因素?n2、统计检验、统计检验n由数理统计理论决定由数理统计理论决定n包括拟合优度检验、总体显著性检验、变量显著包括拟合优度检验、总体显著性检验、变量显著性检验性检验n3、计量经济学检验、计量经济学检验n由计量经济学理论决定由计量经济学理论决定n包括异方差性检验、
20、包括异方差性检验、序列自相关检验、序列自相关检验、多重共多重共线性检验线性检验n4、模型预测检验、模型预测检验n由模型的应用要求决定由模型的应用要求决定n包括稳定性检验:扩大样本重新估计包括稳定性检验:扩大样本重新估计n预测性能检验:对样本外一点进行实际预测预测性能检验:对样本外一点进行实际预测四、计量经济学模型四、计量经济学模型的应用:的应用:n1、结构分析;、结构分析;n2、政策评价、政策评价;n3、经济预测、经济预测n4、理论检验与发展、理论检验与发展1、结构分析、结构分析n对经济现象中变量之间相互关系的研究对经济现象中变量之间相互关系的研究n弹性分析、乘数分析弹性分析、乘数分析n思考:
21、消费与投资的比例多大合适?思考:消费与投资的比例多大合适?2、经济预测、经济预测n通过模拟历史、从已经发生的经济活动中找出变通过模拟历史、从已经发生的经济活动中找出变化规律,以预测未来。化规律,以预测未来。3、政策评价、政策评价n经济政策的不可试验性。经济政策的不可试验性。n计量经济学模型的计量经济学模型的“经济政策实验室经济政策实验室”功能。功能。n例如,通过计量模型可以预测:例如,通过计量模型可以预测:n粮食价格每上涨粮食价格每上涨1%,将会导致粮食产量增加,将会导致粮食产量增加0.2%左右左右n政府支农没增加政府支农没增加1%,将会导致粮食增产,将会导致粮食增产2%4、理论检验与发展、理
22、论检验与发展n实践是检验真理的唯一标准。实践是检验真理的唯一标准。n通过计量经济学模型检验经济学理论,只有当它通过计量经济学模型检验经济学理论,只有当它成功地解释了过去,才能为人们所接受。成功地解释了过去,才能为人们所接受。n对理论假设的检验可以发现和发展理论。对理论假设的检验可以发现和发展理论。主要内容主要内容n1、导论、导论n2、一元线性回归模型、一元线性回归模型n3、多元线性回归模型、多元线性回归模型n4、放宽基本假定的模型、放宽基本假定的模型n5、虚拟变量模型、虚拟变量模型n6、计量经济学计算机教学环节、计量经济学计算机教学环节研究方法研究方法n经验分析(相对于理论分析)经验分析(相对
23、于理论分析)n归纳(相对于演绎归纳(相对于演绎)n计量经济学是实证经济学当中最重要的方法论计量经济学是实证经济学当中最重要的方法论n和马克思的实事求是的思想是相一致和马克思的实事求是的思想是相一致学习方法学习方法n1、每个人都是有潜力的,、每个人都是有潜力的,“差生差生”和和”三好学生三好学生”一样都蕴藏着巨大的潜能一样都蕴藏着巨大的潜能n通过不断的培育和扶持,他们每个人都是可以积通过不断的培育和扶持,他们每个人都是可以积极成长的,教育中不应该有极成长的,教育中不应该有“差生差生”和和“三好学生三好学生”之分,教师应该平等地看待每一位学生并相信每之分,教师应该平等地看待每一位学生并相信每一位学
24、生一位学生(大家要学习许三多的精神)(大家要学习许三多的精神)nThemoreyoudo,themoreyoucando。做得越。做得越多多,能做的也越多。能做的也越多。学习方法学习方法n2、每个人都具有创造力。、每个人都具有创造力。n这种创造潜能的发挥要靠教育来实现。教师并不这种创造潜能的发挥要靠教育来实现。教师并不是知识的权威,学生也不是教师思想的复制者,是知识的权威,学生也不是教师思想的复制者,教育应使学生敢于质疑、不迷信权威,鼓励创新。教育应使学生敢于质疑、不迷信权威,鼓励创新。所以培养学生的创造力是教育的核心内容。所以培养学生的创造力是教育的核心内容。n特别是对于大学教育,许多学术观
25、点还处于讨论特别是对于大学教育,许多学术观点还处于讨论阶段,大家都有权发表自己的看法。阶段,大家都有权发表自己的看法。n所以大学教育老师不一定要讲得每个同学都很懂,所以大学教育老师不一定要讲得每个同学都很懂,只需似懂非懂,要求大家下去之后勤于思考。只需似懂非懂,要求大家下去之后勤于思考。应用领域应用领域n生产函数生产函数n需求函数需求函数n消费函数消费函数n投资函数投资函数n货币需求函数货币需求函数n宏观经济模型宏观经济模型四、四、计量经济学的新发展(略) n一、模型导向的扩展(1)数据导向(2)理论、数据双导向n二、模型结构的扩展(1)非线性模型(2)非因果关系模型(3)变参数模型(4)误差
26、修正模型(5)无参数、半参数模型四、四、计量经济学的新发展 n三、数据类型的扩展(1)面板数据(2)离散被解释变量数据(3)选择性样本数据(4)持续时间被解释变量数据n四、估计方法的扩展(1)最小二乘法和最大似然法的扩展(2)贝叶斯估计 (3)局部回归估计 (4)广义矩估计(5)无参数、半参数模型四、四、计量经济学的新发展 n五、应用领域的扩展(1)微观经济领域 金融市场分析家庭、个人行为分析 (2)非经济领域五、五、计量经济学的分类(略) n从课程内容角度划分理论计量经济学应用计量经济学n从学习的深度划分初级计量经济学中级计量经济学高级计量经济学关于导论主要内容复习关于导论主要内容复习 n计
27、量经济学课程的性质及其重要性n经济模型建模的步骤n计量经济学理论方法的发展例例1:中国制度变迁与经济增长:中国制度变迁与经济增长nlnY=1-2lnX+u,nY表示表示GDP,nX表示制度变迁,表示制度变迁,n2的估计量是的估计量是2.1n诺斯:制度经济学,诺斯:制度经济学,n思考:改革开放可以哪些变量反应?思考:改革开放可以哪些变量反应?例例2:中国证券市场与宏观经济的关系:中国证券市场与宏观经济的关系 n思考:金融发展水平与经济发展的关系思考:金融发展水平与经济发展的关系n财政收入财政收入=1-2股票融资额股票融资额+u,n2的估计量是的估计量是4.729例例3:中国公众对核能接受度的研究
28、:中国公众对核能接受度的研究 n核能接受度核能接受度=1-2文化程度文化程度+3居住地经济发展居住地经济发展水平水平+4职业职业+un收集了收集了1000个样本,其中对核能接受度分为个样本,其中对核能接受度分为5级,级,观测值分别为观测值分别为0,1,2,3,4n发生该错误的原因发生该错误的原因被解释变量的离散的被解释变量的离散的平时成绩评定:占总分的平时成绩评定:占总分的30%n1、考勤、考勤点名点名1次缺席扣次缺席扣平时成绩平时成绩5分分(平时成绩平时成绩总共总共30分分)n2、课堂表现、课堂表现积极提问和回答问题、做好笔记定期检查积极提问和回答问题、做好笔记定期检查n3、平时作业、平时作
29、业Eviews软件操作、计量小论文等软件操作、计量小论文等n挨饿试验:对挨饿试验:对50名试验者,每天只供给正常人一半的食物,仍然按正名试验者,每天只供给正常人一半的食物,仍然按正常人工作。一个月后,这些人除了体重略有下降之外,更重要的是他常人工作。一个月后,这些人除了体重略有下降之外,更重要的是他们当中大多数人整天处于焦虑、恐惧,无视礼节,工作态度消极,不们当中大多数人整天处于焦虑、恐惧,无视礼节,工作态度消极,不求上进,不愿与人交往,甚至产生自卑感。他们除了关心食物之外,求上进,不愿与人交往,甚至产生自卑感。他们除了关心食物之外,对其他事情失去兴趣。对其他事情失去兴趣。n实验说明,当人们基
30、本生活需要没有保证之前,他们就没有动力搞好实验说明,当人们基本生活需要没有保证之前,他们就没有动力搞好其他工作,所以各国都规定最低生活保障费。(如果你请一个乞丐去其他工作,所以各国都规定最低生活保障费。(如果你请一个乞丐去看电影,那他宁愿你给他一个馒头)看电影,那他宁愿你给他一个馒头)n马斯洛:马斯洛:需求层次理论需求层次理论作业作业1n1、样本数据的类型有哪些,分别举例说明;各、样本数据的类型有哪些,分别举例说明;各类数据有什么特点?对数据质量有哪些要求?类数据有什么特点?对数据质量有哪些要求?n2、上网查找近两年、上网查找近两年CPI和和PPI的月度数据的月度数据(或近或近10年的年度数据
31、年的年度数据),以及货币供应量,以及货币供应量M2的月度数的月度数据,分析他们之间的关系。据,分析他们之间的关系。n3、分析、分析2000年以来劳动报酬占年以来劳动报酬占GDP比重,财政比重,财政收入占收入占GDP比重,资本收益占比重,资本收益占GDP比重的变动。比重的变动。n4、收集中国、收集中国2007-2011年年GDP和就业人数和就业人数L数据,数据,并计算其相关系数并计算其相关系数r。第二章第二章 简单线性回归模型简单线性回归模型 n理论基础和参数估计理论基础和参数估计n统计检验和区间估计统计检验和区间估计n违背古典假设的计量经济学问题违背古典假设的计量经济学问题第二章第二章 简单线
32、性回归模型简单线性回归模型 n本章基本要求了解简单计量经济学模型的基本理论与方法,普通最小二乘法有关的参数估计过程和结论,应用计量经济学软件进行简单线性模型的普通最小二乘法估计,独立完成建立简单线性计量经济学模型全过程工作应用要求,独立完成一个综合练习,自己选择研究对象,自己建立理论模型,收集样本数据,进行模型的估计和检验,最后提交一篇小论文,作为平时成绩。 作业:针对某一经济问题或社会问题,分析其影响因作业:针对某一经济问题或社会问题,分析其影响因素,并建立计量经济学模型,完成一篇素,并建立计量经济学模型,完成一篇2000字左右的字左右的论文。论文。 n参考题目:(参考题目:(题目自拟,不限
33、于此题目自拟,不限于此)n国际金融危机与中国经济增长国际金融危机与中国经济增长n房地产价格的影响因素房地产价格的影响因素n广告支出与销售收入的相关性广告支出与销售收入的相关性n外汇储备影响因素外汇储备影响因素n股市涨跌的影响因素股市涨跌的影响因素n人民币升值与进出口贸易人民币升值与进出口贸易n货币供应量、利率与物价货币供应量、利率与物价n收入差距影响因素收入差距影响因素n区域差距影响因素区域差距影响因素n农民收入增长制约因素农民收入增长制约因素选题思路选题思路n一、有研究价值和实际意义一、有研究价值和实际意义党的十八大、总理的政府工作报告党的十八大、总理的政府工作报告n二、数据可得二、数据可得
34、n三、自己感兴趣三、自己感兴趣n科学研究就是找出经济规律。科学研究就是找出经济规律。n比如人民币升值比如人民币升值1%将会使得出口减少?将会使得出口减少?%n货币增长货币增长1%将会引起价格增长?将会引起价格增长?%,GDP增长增长?%n温家宝温家宝2013年两会政府工作报告全文年两会政府工作报告全文(实录实录)nhttp:/ 例:货币政策对中国股票市场的影响例:货币政策对中国股票市场的影响 n摘要、关键词摘要、关键词n第一部分第一部分:必要性研究必要性研究:本文的研究价值。本文的研究价值。即提出当前存在即提出当前存在的问题。(为什么出台货币政策应关注股市)的问题。(为什么出台货币政策应关注股
35、市)n第二部分:国内外研究现状。第二部分:国内外研究现状。在此基础上进行可行性研究在此基础上进行可行性研究n第三部分,研究思路与方法第三部分,研究思路与方法。找出其中主要的因果关系,要。找出其中主要的因果关系,要求建立计量经济模型进行分析:(如求建立计量经济模型进行分析:(如货币供给对股价指数货币供给对股价指数”,“利率变动与股市价格走势)利率变动与股市价格走势)n第四部分,第四部分,“结论和政策建议结论和政策建议”。这部分作者在针对提出的问。这部分作者在针对提出的问题,通过分析和论证的基础上,提出了自己结论和建议。题,通过分析和论证的基础上,提出了自己结论和建议。n参考文献参考文献例:北京房
36、地产业与经济增长的实证分析例:北京房地产业与经济增长的实证分析 n其中第三部分,研究思路与方法其中第三部分,研究思路与方法。要求建立计量经济模型进。要求建立计量经济模型进行分析:建模步骤(参考书行分析:建模步骤(参考书92页)页)1.建立理论模型:首先分析房地产业与经济增长的基建立理论模型:首先分析房地产业与经济增长的基本关系,做出散点图进行观察,理论模型建立的理由,本关系,做出散点图进行观察,理论模型建立的理由,各参数的经济意义及符号、取值范围各参数的经济意义及符号、取值范围2.收集样本数据:需注明数据来源收集样本数据:需注明数据来源3.参数估计:使用最小二乘法估计,参数估计:使用最小二乘法
37、估计,Eviews软件,软件,然后对结果进行评价然后对结果进行评价SALE = -14270.14 + 171.68CITY +87.45SQU (1843.56)()(28.72)()(30.42) (-7.74)()(5.98)()(2.87) R-squared = 0.971 Adjusted R-squared =0.96F = 118.77 4.模型检验:模型检验:经济意义检验经济意义检验统计检验统计检验1)拟合优度检验)拟合优度检验2)方程显著性)方程显著性F检验检验3)变量显著性)变量显著性t检验检验4)区间估计:正确表述各参数的意义。如)区间估计:正确表述各参数的意义。如“边
38、际消费边际消费倾向是以倾向是以99%的概率处在(的概率处在(0.415,0.547)这样一个区)这样一个区间当中间当中”计量经济检验计量经济检验1)多重共线性)多重共线性2)异方差)异方差3)自相关)自相关例:北京房地产业与经济增长的实证分析例:北京房地产业与经济增长的实证分析 5.模型预测(选作)模型预测(选作)把某一年的经济增长率输入模型得到的住房销售量的预测把某一年的经济增长率输入模型得到的住房销售量的预测值,与实际值比较,看实际值是否以值,与实际值比较,看实际值是否以90%的概率落在以预的概率落在以预测值为中心的(测值为中心的(a,b)区间当中)区间当中论文的论文的基本要求基本要求n(
39、一)选题新颖、适时,能针对当前理论或现实的热点、焦点问题。(一)选题新颖、适时,能针对当前理论或现实的热点、焦点问题。在选题上能够反应出作者对理论与现实问题的敏锐观察能力运用所学在选题上能够反应出作者对理论与现实问题的敏锐观察能力运用所学经济理论分析问题的能力。经济理论分析问题的能力。n(二)观点鲜明,有一定的独立见解。明确的观点来源于作者对客观(二)观点鲜明,有一定的独立见解。明确的观点来源于作者对客观规律的深刻而明晰的认识。规律的深刻而明晰的认识。n(三)结构完整,层次分明,论证逻辑严谨。把观点、材料、论证有(三)结构完整,层次分明,论证逻辑严谨。把观点、材料、论证有机地联系起来,就可以表
40、述作者的见解。从已知到未知等来组织内容、机地联系起来,就可以表述作者的见解。从已知到未知等来组织内容、安排文章的结构,这样就易于读者理解。安排文章的结构,这样就易于读者理解。n(四)语言通顺、流畅。要使语言明快,文字流畅,易于理解,就要(四)语言通顺、流畅。要使语言明快,文字流畅,易于理解,就要尽量写得简洁,用词要通俗易懂,尽可能量不用那些生僻、晦涩的词尽量写得简洁,用词要通俗易懂,尽可能量不用那些生僻、晦涩的词语,语,n(五)资料运作得当,资料运用详实、新颖、具有权威性,有说服力。(五)资料运作得当,资料运用详实、新颖、具有权威性,有说服力。1引用要得当,注释要清楚,引文应注明出处。引用要得
41、当,注释要清楚,引文应注明出处。2图表与模型的运图表与模型的运用。应正确的应用与处理表与图。图标直观性强,数学公式模型更具用。应正确的应用与处理表与图。图标直观性强,数学公式模型更具有说服力。有说服力。论文的论文的基本要求基本要求n完成时间:完成时间:14周前周前n提交方式:提交方式:发到邮箱:发到邮箱:邮件名称注明:姓名、班级、学号邮件名称注明:姓名、班级、学号第一节第一节 回归分析与回归函数回归分析与回归函数n一、相关分析与回归分析;一、相关分析与回归分析;n二、总体回归函数,二、总体回归函数,n三、随机扰动项,三、随机扰动项,n四、样本回归函数。四、样本回归函数。一、相关分析与回归分析一
42、、相关分析与回归分析n1、变量间的关系、变量间的关系n经济变量之间的关系,大体上可分为两类经济变量之间的关系,大体上可分为两类n(1)确定性关系或函数关系,研究的是确定现)确定性关系或函数关系,研究的是确定现象非随机变量间的关系象非随机变量间的关系nn(2)不确定的统计关系或者相关关系,研究的)不确定的统计关系或者相关关系,研究的是随机变量之间的非确定关系是随机变量之间的非确定关系相关关系与因果关系相关关系与因果关系n相关关系:当某一变量取一定的数值时,与之相相关关系:当某一变量取一定的数值时,与之相对应的另一随机变量的值虽然不确定,但它仍按对应的另一随机变量的值虽然不确定,但它仍按某种规律在
43、一定的范围内变化。变量间的这种相某种规律在一定的范围内变化。变量间的这种相互关系,称为具有不确定性的相关关系互关系,称为具有不确定性的相关关系n因果关系:如果某一变量的变动引起其他变量的因果关系:如果某一变量的变动引起其他变量的变动,变量间的这种关系叫做因果联系。变动,变量间的这种关系叫做因果联系。案例分析案例分析n世界上一切事物都是普遍联系的世界上一切事物都是普遍联系的(马克思哲学马克思哲学)n“如果你的数学成绩较好,那么经济学也一定学如果你的数学成绩较好,那么经济学也一定学得不错得不错”n“某同学研究冷饮点与气温之间的关系某同学研究冷饮点与气温之间的关系”n近近20年来我国年来我国GDP持
44、续增长,而某同学身高也不持续增长,而某同学身高也不断长高,这两者之间是否存在相关关系或因果关断长高,这两者之间是否存在相关关系或因果关系?系?n近近20年来我国年来我国GDP持续增长,而城乡收入差距也持续增长,而城乡收入差距也不断扩大不断扩大一、相关分析与回归分析一、相关分析与回归分析n对变量间相关关系的考察主要通过相关分析对变量间相关关系的考察主要通过相关分析(correlationanalysis和回归分析(和回归分析(regressionanalysis)来完成的)来完成的相关关系相关关系相关程度相关程度变化方向变化方向正相关正相关负相关负相关完全相关完全相关不相关不相关因果关系因果关系
45、回归分析回归分析注意:注意:n不存在线性相关并不意味着不相关不存在线性相关并不意味着不相关n有相关关系并不一定存在因果关系有相关关系并不一定存在因果关系n相关分析对称地对待任何(两个)变量,两个变相关分析对称地对待任何(两个)变量,两个变量都被看着是随机的。但是回归分析对变量的处量都被看着是随机的。但是回归分析对变量的处理方法存在不对称性,它里面把变量区分为被解理方法存在不对称性,它里面把变量区分为被解释变量和解释变量,作为被解释变量他是随机变释变量和解释变量,作为被解释变量他是随机变量,作为解释变量我们假定它是确定性变量。量,作为解释变量我们假定它是确定性变量。(一)相关关系的度量:相关系数
46、(一)相关关系的度量:相关系数n1、总体相关系数、总体相关系数n总体相关系数一般是未知的,可用样本相关系数总体相关系数一般是未知的,可用样本相关系数估计。样本相关系数是总体相关系数的一致估计。估计。样本相关系数是总体相关系数的一致估计。n2、样本相关系数、样本相关系数3、相关系数的特点、相关系数的特点n1、相关系数的取值范围(、相关系数的取值范围(-1,1)n2、当、当r=0时,表示时,表示X和和Y不相关不相关n3、当、当0r0表示表示X与与Y正相关,若正相关,若r0表示表示X与与Y负相关负相关n4、r越接近越接近1,表示,表示X与与Y的相关性越强;当的相关性越强;当r=1时,表示时,表示X与
47、与Y完全线性相关。若完全线性相关。若r=1表示表示X与与Y完全正相关,若完全正相关,若r=-1表示表示X与与Y完全负相关完全负相关(二)回归分析的基本概念(二)回归分析的基本概念n回归分析是研究一个变量关于另一个(些)变量回归分析是研究一个变量关于另一个(些)变量的具体依赖关系的具体依赖关系(因果关系因果关系)的计算方法和理论。的计算方法和理论。n其目的在于通过后者其目的在于通过后者(解释变量或自变量解释变量或自变量)的已知的已知或设定值,去估计和预测前者或设定值,去估计和预测前者(被解释变量或被被解释变量或被解释变量解释变量)的(总体)均值。的(总体)均值。2. 回归分析的基本概念回归分析的
48、基本概念n这里前一个变量称之为被解释变量(这里前一个变量称之为被解释变量(ExplainedVariable)或应变量()或应变量(DependentVariable),后),后一个(些)变量称为解释变量(一个(些)变量称为解释变量(ExplanatoryVariable)或自变量()或自变量(IndependentVariable)2、回归分析的基本概念、回归分析的基本概念n由于变量间关系的随机性,由于变量间关系的随机性,回归分析关心的是根回归分析关心的是根据解释变量的已知或给定值,考察被解释变量的据解释变量的已知或给定值,考察被解释变量的总体均值总体均值n即当解释变量取某个确定值时,与之统
49、计相关的即当解释变量取某个确定值时,与之统计相关的被解释变量所有可能出现的对应值的平均值。被解释变量所有可能出现的对应值的平均值。随机变量随机变量n随机游走:指基于过去的表现,无法预测将来的随机游走:指基于过去的表现,无法预测将来的发展步骤和方向。其概念接近于布朗运动发展步骤和方向。其概念接近于布朗运动n一个醉酒人的无规则行走一个醉酒人的无规则行走。如何寻找?。如何寻找?n最佳的方法是从投放点开始寻找。最佳的方法是从投放点开始寻找。n英国统计学家肯德尔在应用时间序列分析研究股英国统计学家肯德尔在应用时间序列分析研究股票价格波动并试图得出股票价格波动的模式时,票价格波动并试图得出股票价格波动的模
50、式时,得到了一个令人大感意外的结论:股票价格没得到了一个令人大感意外的结论:股票价格没有任何规律可寻,它就象有任何规律可寻,它就象“一个醉汉走步一样。一个醉汉走步一样。”股价遵循的是随机游走规律。股价遵循的是随机游走规律。n回归分析构成了计量经济学的方法论基础,其主回归分析构成了计量经济学的方法论基础,其主要内容包括:要内容包括:n(1)根据样本观测值对计量经济学模型参数进)根据样本观测值对计量经济学模型参数进行估计,求得回归方程;行估计,求得回归方程;n(2)对回归方程的参数值进行检验;)对回归方程的参数值进行检验;n(3)利用回归方程进行分析、评价及预测。)利用回归方程进行分析、评价及预测
51、。相关分析与回归分析的联系相关分析与回归分析的联系n相关分析与回归分析都是对变量间相关关系进行相关分析与回归分析都是对变量间相关关系进行研究,相关分析是解决客观事物或现象相互关系研究,相关分析是解决客观事物或现象相互关系密切程度的问题,而回归则是用函数的形式表示密切程度的问题,而回归则是用函数的形式表示变量之间的因果关系。变量之间的因果关系。n二者相互补充,只有当变量间存在一定程度的相二者相互补充,只有当变量间存在一定程度的相关关系时,才能进行回归分析;而在进行相关分关关系时,才能进行回归分析;而在进行相关分析时,如果要具体确定变量间相关的具体数学形析时,如果要具体确定变量间相关的具体数学形式
52、,又依赖于回归分析。式,又依赖于回归分析。相关分析与回归分析的区别相关分析与回归分析的区别n相关分析是分析两个以上变量的样本观测值序列之间的相关分析是分析两个以上变量的样本观测值序列之间的随机数学关系,用相关系数来衡量。随机数学关系,用相关系数来衡量。n回归分析是分析两个或两个以上变量之间的相互依赖关回归分析是分析两个或两个以上变量之间的相互依赖关系或因果关系,作为结果的变量系或因果关系,作为结果的变量(被解释变量或因变量被解释变量或因变量)是由作为原因的变量是由作为原因的变量(解释变量或自变量解释变量或自变量)所决定的,原所决定的,原因变量的变化引起结果变量的变化。因果关系有单向因因变量的变
53、化引起结果变量的变化。因果关系有单向因果关系和互为因果关系之分。果关系和互为因果关系之分。n回归分析的因果关系一定具有数学上的相关关系。而具回归分析的因果关系一定具有数学上的相关关系。而具有相关关系的变量之间并不一定具有因果关系。有相关关系的变量之间并不一定具有因果关系。二、总体回归函数二、总体回归函数n例例2.1:一个假想的社区有:一个假想的社区有100户家庭组成,要研户家庭组成,要研究该社区每月家庭消费支出究该社区每月家庭消费支出Y与每月家庭可支配与每月家庭可支配收入收入X的关系。的关系。即如果知道了家庭的月收入,能即如果知道了家庭的月收入,能否预测该社区家庭的平均月消费支出水平。否预测该
54、社区家庭的平均月消费支出水平。n为达到此目的,将该为达到此目的,将该100户家庭划分为组内收入户家庭划分为组内收入差不多的差不多的10组,以分析每一收入组的家庭消费支组,以分析每一收入组的家庭消费支出。出。例2.1n假如有假如有100个家庭,考察他们每月消费支出个家庭,考察他们每月消费支出Y与与可支配支出之间的关系。可支配支出之间的关系。n如果知道了家庭的月收入,能否预测该家庭平均如果知道了家庭的月收入,能否预测该家庭平均月消费支出水平月消费支出水平n按收入水平分为按收入水平分为10个组,分别计算各组的条件均个组,分别计算各组的条件均值值分析分析n由于不确定因素的影响,对同一收入水平由于不确定
55、因素的影响,对同一收入水平X,不,不同家庭的消费支出不完全相同。同家庭的消费支出不完全相同。n但由于调查的完备性,给定收入水平但由于调查的完备性,给定收入水平X的消费支的消费支出出Y的分布是确定的,即以的分布是确定的,即以X给定值为条件的给定值为条件的Y的的条件分布(条件分布(Conditionaldistribution)是已知的,)是已知的,如:如:P(Y=561X=800)=1/4n统计学知识回顾统计学知识回顾分析分析n因此,给定收入因此,给定收入X的值的值Xi,可得消费支出,可得消费支出Y的条的条件均值(件均值(conditionalmean)或条件期望)或条件期望(condition
56、alexpectation)n该例中:该例中:E(YX=800)=605n从散点图发现:随着收入的增加,消费的条件从散点图发现:随着收入的增加,消费的条件均值也在增加,且均值也在增加,且Y的条件均值落在一根正斜率的条件均值落在一根正斜率的直线上,这条线称为总体回归线的直线上,这条线称为总体回归线n概念:在给定解释变量概念:在给定解释变量Xi条件下被解释变量条件下被解释变量Y的期望轨迹称为总体回归线(的期望轨迹称为总体回归线(populationregressionline),那么相应的函数(或者说),那么相应的函数(或者说方程)方程)E(YXi)=f(Xi)n称为总体回归函数(称为总体回归函数
57、(PRF)()(populationregressionfunction)n简单线性简单线性总体回归函数总体回归函数可表示为可表示为(2-1)n含义:含义:回归函数(回归函数(PRF)说明被解释变量)说明被解释变量Y的平均状态(总体条件期望)随解释变的平均状态(总体条件期望)随解释变量量X变化的规律。变化的规律。n函数形式:可以是线性或非线性的。函数形式:可以是线性或非线性的。n例例2.1中,将居民消费支出看成是其可中,将居民消费支出看成是其可支配收入的线性函数时支配收入的线性函数时:n为一线性函数。其中,为一线性函数。其中, 1, 2是未知参是未知参数,称为回归系数(数,称为回归系数(reg
58、ressioncoefficients)。)。三、随机误差项三、随机误差项n1、随机误差项的引入、随机误差项的引入n总体回归函数说明在给定收入水平总体回归函数说明在给定收入水平Xi下,该社区下,该社区家庭的平均消费支出水平。家庭的平均消费支出水平。n但对某一个别的家庭,其消费支出可能与平均水但对某一个别的家庭,其消费支出可能与平均水平有偏差,记平有偏差,记ni=Yi-E(YXi)ni=Yi-0-1Xi(2-2)n某一个别的家庭,其消费支出与该平均水平某一个别的家庭,其消费支出与该平均水平的偏差。称为观察值围绕它的期望值的的偏差。称为观察值围绕它的期望值的离差离差(deviation),该),该
59、离差离差是一个随机变量,又是一个随机变量,又称为称为随机干扰项随机干扰项(stochasticdisturbance)或)或随机误差项随机误差项(stochasticerror)。)。n例例2.1中,给定收入水平中,给定收入水平Xi,个别家庭的支出个别家庭的支出Yi可表示可表示为两部分之和:为两部分之和:n(1)该收入水平下所有家庭的平均消费支出)该收入水平下所有家庭的平均消费支出E(Y|Xi),称为,称为系统性(系统性(systematic)或或确定性确定性(deterministic)部分;部分;n(2)其他)其他随机随机或或非确定性(非确定性(nonsystematic)部分部分i。n式
60、式2-3称为总体回归函数称为总体回归函数PRF的随机形式,表明被解的随机形式,表明被解释变量除了受解释变量的系统性影响外,还受其他释变量除了受解释变量的系统性影响外,还受其他因素的随机影响因素的随机影响n由于方程中引入了随机误差项,所以方程就成为了由于方程中引入了随机误差项,所以方程就成为了计量经济学模型,因此也称之为总体回归模型计量经济学模型,因此也称之为总体回归模型(2-3)2、随机扰动项、随机扰动项 的影响因素的影响因素n(1)在解释变量中被忽略因素的影响)在解释变量中被忽略因素的影响n(2)变量观测值的观察误差)变量观测值的观察误差n(3)模型关系的设定误差)模型关系的设定误差n(4)
61、其他随机因素的影响)其他随机因素的影响3、引入随机误差项的原因、引入随机误差项的原因n(1)理论的含糊性)理论的含糊性n(2)数据的欠缺)数据的欠缺n(3)节省原则)节省原则四、样本回归函数四、样本回归函数n1、问题的提出、问题的提出n由于总体的信息往往无法掌握,现实的情况只能由于总体的信息往往无法掌握,现实的情况只能在一次观察中得到总体的一组样本在一次观察中得到总体的一组样本n问题是能不能从一次抽样中获得总体的近似信息,问题是能不能从一次抽样中获得总体的近似信息,如果可以的话,那么如何从抽样中获得总体的近如果可以的话,那么如何从抽样中获得总体的近似信息?似信息?可支配收入X800110014
62、00 1700 2000 2300 2600 2900 3200 3500消费支出Y594638112211551408 1595 1969 2078 2585 2530n例例2.2:在例:在例2.1的总体重抽取如下一个样本,问的总体重抽取如下一个样本,问能否从该样本估计总体回归函数能否从该样本估计总体回归函数PRFn样本散点图近似与一条直线,画出一条直线来很样本散点图近似与一条直线,画出一条直线来很好的拟合这些散点图,由于样本取自于总体,可好的拟合这些散点图,由于样本取自于总体,可以用该线来近似地代表总体回归线,样本回归线以用该线来近似地代表总体回归线,样本回归线(sampleregress
63、ionlines)n该样本散点图该样本散点图n记样本回归线的函数形式为:记样本回归线的函数形式为:称为称为样本回归函数样本回归函数(sampleregressionfunction,SRF)。(2-4)则则 注意:注意:这里这里将将样本回归线样本回归线看成看成总体回归线总体回归线的近似替代的近似替代n将样本回归函数(将样本回归函数(2-4)看着是总体回归函数)看着是总体回归函数(2-1)的一个近似表达形式)的一个近似表达形式(2-4)同样地,对某一个个体观测值同样地,对某一个个体观测值YiYi,它并不完全等,它并不完全等于样本条件均值于样本条件均值YiYi,二者之差可用,二者之差可用eiei表
64、示:表示: 由于方程中引入了随机项,成为计量经济模由于方程中引入了随机项,成为计量经济模型,因此也称为型,因此也称为样本回归模型样本回归模型(sampleregressionmodel)。 式中,式中,eiei称为残差(或剩余项)代表其他影响称为残差(或剩余项)代表其他影响YiYi的随机因素的集合,可以看成的随机因素的集合,可以看成ii的估计量的估计量样本回归函数的随机形式样本回归函数的随机形式/样本回归模型:样本回归模型:3、回归分析的主要目的:、回归分析的主要目的:n根据样本回归函数根据样本回归函数SRF,估计总体回归函数,估计总体回归函数PRF。n由于样本回归函数是通过样本观测值拟合的,
65、而由于样本回归函数是通过样本观测值拟合的,而样本是从总体当中随机抽取出来的,所以只有样样本是从总体当中随机抽取出来的,所以只有样本回归函数较好的拟合了样本值观测值,就可以本回归函数较好的拟合了样本值观测值,就可以使样本回归函数尽可能地接近总体回归函数使样本回归函数尽可能地接近总体回归函数n这里总体回归函数这里总体回归函数PRF是未知的。是未知的。XiuieiSRFPRFYiXE(YXi)样本回归函数与总体回归函数的基本关系样本回归函数与总体回归函数的基本关系Yi2.2 一元线性回归模型的参数估计 一、线性回归模型的特征二、一元线性回归模型的基本假设三、参数的普通最小二乘估计(OLS)四、最小二
66、乘估计量的性质 五、参数估计量的概率分布及随机干 扰项方差的估计2013年1月111线性回归模型的特征一个例子,消费模型,这是根据凯恩斯的绝对收入假设提出来的,消费(C)是由收入(Y)唯一决定的,是收入的线性函数:C=+Y但实际上上述等式不能准确实现,原因(1)消费除受收入影响外,还受其他因素影响(2)这个线性关系也是一个近似的线性关系(3)收入观测值本身也有统计误差n一个更符合实际的数学描述应该是一个更符合实际的数学描述应该是nC=+Y+,n其中,其中,是一个随机误差项,是其他影响因素的是一个随机误差项,是其他影响因素的综合体综合体n(1)通过引入随机误差项,将变量之间的关系)通过引入随机误
67、差项,将变量之间的关系用一个线性随机方程来描述,并用随机数学方法用一个线性随机方程来描述,并用随机数学方法来估计方程中的参数来估计方程中的参数n(2)在线性回归模型中,被解释变量的特征是)在线性回归模型中,被解释变量的特征是由解释变量与随机误差项共同决定由解释变量与随机误差项共同决定线性回归模型的普遍性线性回归模型的普遍性 P82n线性回归模型是计量经济学模型的主要形式,许线性回归模型是计量经济学模型的主要形式,许多实际经济活动中经济变量之间的复杂关系都可多实际经济活动中经济变量之间的复杂关系都可以通过一些简单的数学处理,使之化为数学上的以通过一些简单的数学处理,使之化为数学上的线性关系线性关
68、系n大道至简。大道至简。n(1)变量置换)变量置换n例如描述税收与税率关系的拉弗曲线:例如描述税收与税率关系的拉弗曲线:s=a+br+cr2 ct/2(n-2),则拒绝H0,接受H1;若|t|t/2(n-2),则拒绝H1,接受H0;H H0 0值值值值临界值临界值临界值临界值临界值临界值临界值临界值 /2 /2 /2 样本统计量样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域接受域接受域接受域接受域抽样分布抽样分布抽样分布抽样分布1 - 1 - 置信水平置信水平置信水平置信水平 对于一元线性回归方程中的0,可构造如下t统计量进行显著性检验:在上述收入-消费支出例中
69、,首先计算2的估计值t统计量的计算结果分别为:给定显著性水平=0.05,查t分布表得临界值t0.05/2(8)=2.306|t1|2.306,说明家庭可支配收入在家庭可支配收入在95%95%的置信度的置信度下显著,即是消费支出的主要解释变量;下显著,即是消费支出的主要解释变量; |t2|临界值临界值1.96,小概,小概率事件发生了,拒绝原假设。率事件发生了,拒绝原假设。n结论:通过对变量进行显著性检验表明,有结论:通过对变量进行显著性检验表明,有70%的概率认为,即的概率认为,即X对对Y有显著性影响。有显著性影响。7、区间估计的步骤、区间估计的步骤n1、计算参数、计算参数n2、计算参数估计值的
70、方差、计算参数估计值的方差7、区间估计的步骤、区间估计的步骤n3、根据显著性水平,查表得到临界值:、根据显著性水平,查表得到临界值:=0.30,临界值:,临界值:n4、计算置信区间、计算置信区间n结论:由于一次抽样得到结论:由于一次抽样得到1的估计值为的估计值为5,因此,因此在在0.30的置信水平下的置信水平下(即我们有即我们有70%的把握的把握)认为认为总体参数落在总体参数落在(3,7)的区间范围内。的区间范围内。第三章多元线性回归模型n一、多元线性回归模型一、多元线性回归模型n二、多元线性回归模型的参数估二、多元线性回归模型的参数估计计n三、三、OSLOSL估计量的统计性质估计量的统计性质
71、n四、参数估计量的方差四、参数估计量的方差- -协方差协方差矩阵和随机误差项方差的估计矩阵和随机误差项方差的估计n五、样本容量问题五、样本容量问题 n六、多元线性回归模型实例六、多元线性回归模型实例 2013年1月280第一节第一节 多元线性回归模型多元线性回归模型n一、多元线性回归模型的形式一、多元线性回归模型的形式n为什么要使用为什么要使用多元回归模型,多元回归模型,由于:由于:实际经济问题中,一个变量往往受到多个原因变实际经济问题中,一个变量往往受到多个原因变量的影响量的影响 “从一般到简单从一般到简单”的建模思路的建模思路 n如果线性回归模型的解释变量有多个,称为如果线性回归模型的解释
72、变量有多个,称为多元多元线性回归模型线性回归模型n多元线性回归模型的参数估计原理与一元线性回多元线性回归模型的参数估计原理与一元线性回归模型相同,只是计算更为复杂归模型相同,只是计算更为复杂 1、多元总体线性回归模型的一般形式、多元总体线性回归模型的一般形式n其中:k为解释变量的个数,n为样本个数n习惯上把常数项0看成一个虚拟变量的系数,该虚拟变量的样本观测值始终取12、总体回归函数、总体回归函数n对上式两边求条件期望对上式两边求条件期望n多元回归分析是以多个解释变量的固定值为条件多元回归分析是以多个解释变量的固定值为条件的回归分析,并且所获得的是诸变量的回归分析,并且所获得的是诸变量Xi值固
73、定时值固定时Y的平均值,诸的平均值,诸i称为偏回归系数称为偏回归系数偏回归系数的含义偏回归系数的含义n偏回归系数偏回归系数1是度量在是度量在X2,X3Xk保持不变的情保持不变的情况下,况下,X1每变动每变动1个单位时,个单位时,Y的均值的均值E(Y)的变)的变化。化。n其他的参数其他的参数2,3k含义与之相同含义与之相同n当当X1,X2,X3Xk相互独立时,由多元线性回归相互独立时,由多元线性回归模型估计得到的偏回归系数与仅用该变量作为解释模型估计得到的偏回归系数与仅用该变量作为解释变量构成的一元模型的估计结果(参数)相同。变量构成的一元模型的估计结果(参数)相同。3、样本回归函数、样本回归函
74、数n 4 4、多元总体线性回归模型的矩阵形式n多元总体线性回归模型的矩阵表达式:Y=X+U -(3.11)n 5 5、多元总体线性回归函数条件均值的矩阵表达式:E(Y)=X -(3.12)n 6、多元样本线性回归函数条件均值的矩阵表达式:(三)(三)多元线性回归模型的基本假设多元线性回归模型的基本假设在满足以下基本假设前提下,才能使用普通最小二乘法(OSL)估计参数假设1、解释变量X1,X2Xk是确定性变量,不是随机变量;且各X之间互不相关(无多重共线性)解释变量观测值矩阵X为列满秩矩阵R(X)=k假设2、随机误差项u具有零均值、同方差以及不序列相关性E(i)=0i=1,2,nVar()=2I
75、n无自相关假定,随机误差项在不同样本点之间互不相关Cov(i,j)=Ei-E(i)j-E(j)=E(ij)=0iji,j=1,2,n假设假设3. 3. 随机误差项随机误差项u u与解释变量与解释变量X X之间不相关:之间不相关: Cov(Xji, Cov(Xji, i)=0 j=1,2, ,k; i=1,2, ,n i)=0 j=1,2, ,k; i=1,2, ,n 假设假设4. 4. u u服从零均值、同方差的正态分布服从零均值、同方差的正态分布 i iN(0, N(0, 2 2 ) i=1,2, ,n ) i=1,2, ,n二、多元线性回归模型的参数估计(一)普通最小二乘估计对于随机抽取的
76、对于随机抽取的n组观测值(组观测值(Yi,Xji),i=1,2,n;j=1,2k如果样本函数样本函数的参数估计值已经得到,则有:于是得到关于待估参数估计值的正规方程组正规方程组:两边同乘以样本观测值矩阵两边同乘以样本观测值矩阵X X的转置矩阵的转置矩阵XX,有,有即由于XX满秩,以(XX XX )-1-1,左乘上式两端,得到参,左乘上式两端,得到参数数的最小二乘估计式的矩阵表达式的最小二乘估计式的矩阵表达式根据样本回归函数根据样本回归函数的矩阵形式,矩阵形式,由极值条件由极值条件Xe=0Xe=0,可得正规方程组,可得正规方程组的矩阵形矩阵形式式例例3.2.1:在例2.1.1的家庭收入家庭收入-
77、消费支出消费支出例中,可求得于是 三、参数估计量的性质三、参数估计量的性质 在满足基本假设的情况下,其结构参数在满足基本假设的情况下,其结构参数的的普通最普通最小二乘估计小二乘估计、最大或然估计及及矩估计仍具有:仍具有: 线性性、无偏性、有效性。 同时,随着样本容量增加,参数估计量具有: 渐近无偏性、渐近有效性、一致性渐近无偏性、渐近有效性、一致性。1、线性性、线性性其中,C=(XX)-1X为一仅与固定的X有关的行向量2、无偏性、无偏性这里利用了假设: E(X )=03、有效性(最小方差性)、有效性(最小方差性)其中利用了和 五、样本容量问题 所谓所谓“最小样本容量”,即从最小二乘原理和最大或
78、,即从最小二乘原理和最大或然原理出发,欲得到参数估计量,不管其质量如何,所要然原理出发,欲得到参数估计量,不管其质量如何,所要求的样本容量的下限。求的样本容量的下限。计量模型分析当中如何确定样本容量计量模型分析当中如何确定样本容量最小样本容量的确定最小样本容量的确定 样本最小容量必须不少于模型中解释变量样本最小容量必须不少于模型中解释变量的数目(包括常数项)的数目(包括常数项),即 n k+1因为,无多重共线性要求:秩(X)=k+1 2 2、满足基本要求的样本容量、满足基本要求的样本容量从统计检验的角度从统计检验的角度:n30时,Z检验才能应用;n-k8时, t分布较为稳定 一般经验认为一般经
79、验认为: 当n30或者至少n3(k+1)时,才能说满足模型估计的基本要求。 模型的良好性质只有在大样本下才能模型的良好性质只有在大样本下才能得到理论上的证明得到理论上的证明四,关于参数估计量的方差-协方差矩阵2 2、随机误差项、随机误差项u u的方差的方差 的无偏估计的无偏估计模型实例:电力消费模型模型实例:电力消费模型Dependent Variable: YMethod: Least SquaresDate: 11/18/08 Time: 11:45Sample: 2001 2011Included observations: 11VariableCoefficientStd. Error
80、t-StatisticProb. C1941.837390.21944.9762690.0011X20.0935990.0093999.9579790X3-17.15073.701046-4.634010.0017R-squared0.946883 Mean dependent var320.0209Adjusted R-squared0.933603 S.D. dependent var140.1201S.E. of regression36.10549 Akaike info criterion10.23777Sum squared resid10428.85 Schwarz criter
81、ion10.34628Log likelihood-53.3077 F-statistic71.30507Durbin-Watson stat2.182607 Prob(F-statistic)0.000008问题:参数估计量是随机的还是确定的?问题:参数估计量是随机的还是确定的?疑问:在无偏性的证明中把参数疑问:在无偏性的证明中把参数的估计量看着是的估计量看着是随机变量,而在正规方程组的推导中又将它看着确随机变量,而在正规方程组的推导中又将它看着确定值,如何解释。定值,如何解释。 解释:将一组具体样本资料代入参数估计量的表达解释:将一组具体样本资料代入参数估计量的表达式给出的参数估计结果是一
82、个式给出的参数估计结果是一个“估计值估计值”,或者,或者“点估计点估计”,是参数估计量的一个具体数值,是确定,是参数估计量的一个具体数值,是确定的的但从另一个角度,仅仅把它看成是参数估计量的一但从另一个角度,仅仅把它看成是参数估计量的一个表达式,那么它是被解释变量观测值的函数,而个表达式,那么它是被解释变量观测值的函数,而被解释变量是随机的,所以参数估计量是随机变量被解释变量是随机的,所以参数估计量是随机变量 *(二)、最大或然估计(略) 对于多元线性回归模型对于多元线性回归模型易知抽取抽取Y的随机抽取的n组样本观测值的联合概率即为变量Y的或然函数或然函数对数或然函数为对对数或然函数求极大值,
83、也就是对求极小值。 因此,参数的最大或然估计最大或然估计为为结果与参数的普通最小二乘估计相同结果与参数的普通最小二乘估计相同*(三)、矩估计(MomentMethod,MM) (略)(略)OLS估计是通过得到一个关于参数估计值的估计是通过得到一个关于参数估计值的正规方程组并对它进行求解而完成的。 该该正规方程组正规方程组可以从另外一种思路来导:求期望:用每一个解释变量分别乘以模型的两边,并用每一个解释变量分别乘以模型的两边,并对所有样本点求和,即得到对所有样本点求和,即得到 对用每一个的两边求期望,有对用每一个的两边求期望,有 得到一直矩条件得到一直矩条件 求解这组矩条件,记得到参数估计量求解
84、这组矩条件,记得到参数估计量与与OSLOSL,MLML估计量等价估计量等价 称为原总体回归方程的一组矩条件矩条件,表明了原总体回归方程所具有的内在特征。由此得到正规方程组正规方程组解此正规方程组即得参数的MM估计量。 易知MM估计量与与OLS、ML估计量等价。矩方法矩方法是是工具变量方法工具变量方法(InstrumentalVariables,IV)和和广义矩估计方法广义矩估计方法(GeneralizedMomentMethod,GMM)的基础的基础在在矩方法矩方法中关键是利用了中关键是利用了E(X )=0如果某个解释变量与随机项相关,只要能找到1个工具变量,仍然可以构成一组矩条件。这就是IV
85、。如果存在k+1个变量与随机项不相关,可以构成一组包含k+1方程的矩条件。这就是GMM。3.3多元线性回归模型的统计检验 一、拟合优度检验 二、方程的显著性检验(F检验) 三、参数的显著性检验(t检验) 四、参数的区间估计n回归分析是要通过样本所估计的参数来代替总体的是要通过样本所估计的参数来代替总体的真实参数,或者说是用样本回归线代替总体回归真实参数,或者说是用样本回归线代替总体回归线。线。 尽管从统计性质统计性质上已知,如果有足够多的重复 抽样,参数的估计值的期望(均值)就等于其总体的参数真值,但在一次抽样中,估计值不一定就等于该真值。 那么,在一次抽样中,参数的估计值与真值的差异有多大,
86、是否显著,这就需要进一步进行统计检验统计检验。 主要包括拟合优度检验拟合优度检验、变量的显著性检验显著性检验及参数的区间估计区间估计。一、拟合优度检验一、拟合优度检验n拟合优度检验:是对样本回归直线与样本观测值拟合优度检验:是对样本回归直线与样本观测值之间拟合程度的检验。之间拟合程度的检验。n度量拟合优度的指标:判定系数(可决系数)度量拟合优度的指标:判定系数(可决系数)R2n通过构造一个可以表征拟合程度的统计量来实现通过构造一个可以表征拟合程度的统计量来实现 一、拟合优度检验一、拟合优度检验为什么要进行拟合优度检验为什么要进行拟合优度检验问题:问题:采用最小二乘法对参数进行估计,已经保证采用
87、最小二乘法对参数进行估计,已经保证了模型最好的拟合了样本观测值,为什么还要检验了模型最好的拟合了样本观测值,为什么还要检验拟合优度呢?拟合优度呢?答案答案:选择合适的估计方法所保证了最好拟合,是:选择合适的估计方法所保证了最好拟合,是同一个样本、同一个模型内部不同估计方法的比较同一个样本、同一个模型内部不同估计方法的比较拟合优度检验结果所表示的优劣是对同一个经济问拟合优度检验结果所表示的优劣是对同一个经济问题,不同模型、不同样本之间的比较题,不同模型、不同样本之间的比较一般来说,样本容量越多,拟合优度越好;解释变一般来说,样本容量越多,拟合优度越好;解释变量越多,拟合优度越好量越多,拟合优度越
88、好检验模型对样本观测值的拟合程度检验模型对样本观测值的拟合程度两个例子两个例子Dependent Variable: CONSUMEMethod: Least SquaresDate: 11/18/08 Time: 10:22Sample: 2001 2010Included observations: 10VariableCoefficientStd. Errort-StatisticProb. C35276.582554.5963480.0018INCOME0.530.02155324.590180R-squared0.986943 Mean dependent var2074.5Adju
89、sted R-squared0.98531 S.D. dependent var807.6174S.E. of regression97.88386 Akaike info criterion12.1823Sum squared resid76650 Schwarz criterion12.24281Log likelihood-58.9115 F-statistic604.6771Durbin-Watson stat1.917221 Prob(F-statistic)0Dependent Variable: CONSUMEMethod: Least SquaresDate: 11/18/08
90、 Time: 10:29Sample: 2001 2010Included observations: 10VariableCoefficientStd. Errort-StatisticProb. C385.5939290.32631.328140.2208INCOME0.5118790.0817096.2646450.0002R-squared0.830673 Mean dependent var2049.2Adjusted R-squared0.809507 S.D. dependent var850.2133S.E. of regression371.0801 Akaike info
91、criterion14.84757Sum squared resid1101603 Schwarz criterion14.90809Log likelihood-72.2379 F-statistic39.24578Durbin-Watson stat3.799993 Prob(F-statistic)0.000242例如一个消费模型,例如一个消费模型,Q=1+2P。通过一组样本估计出样。通过一组样本估计出样本回归函数是本回归函数是Q=5+2P。当价格为。当价格为5时,需求量为时,需求量为15。如果假设指考察低收入(或高收入)家庭的消费函数,如果假设指考察低收入(或高收入)家庭的消费函数,那
92、样本的观测值就较集中。那样本的观测值就较集中。5 51515 由于没有考虑收入对由于没有考虑收入对需求量的影响,可能需求量的影响,可能收集的样本观测值就收集的样本观测值就很分散,导致残差平很分散,导致残差平方和较大。模型的拟方和较大。模型的拟合优度较差,模型对合优度较差,模型对被解释变量的解释能被解释变量的解释能力较低力较低如何进行拟合优度检验如何进行拟合优度检验总离差的分解:总离差的分解:TSS=ESS+RSS自由度自由度:(:(n-1)=(n-k)+(k-1)可决系数:可决系数:通过构造一个可以表征拟合程度的统计量来实现通过构造一个可以表征拟合程度的统计量来实现问题:要使模型拟合得好,就必
93、须增加解释变量问题:要使模型拟合得好,就必须增加解释变量增加解释变量必定使得统计量的自由度(增加解释变量必定使得统计量的自由度(n-k)减少)减少可决系数可决系数该统计量越接近于1,模型的拟合优度越高。 问题:问题: 在应用过程中发现,如果在模型中增加一个解释变量,R2往往增大(Why?)这就给人一个错觉一个错觉:要使得模型拟合得好,只要使得模型拟合得好,只要增加解释变量即可要增加解释变量即可。但是,现实情况往往是,由增加解释变量个数引起的R2的增大与拟合好坏无关,R2需调整需调整。调整的可决系数调整的可决系数用自由度去修正可决系数用自由度去修正可决系数R2在样本容量一定的情况下,增加解释变量
94、必定使得自由度减少,所以调整的思路是:将残差平方和与总离差平方和分别除以各自将残差平方和与总离差平方和分别除以各自的自由度,以剔除变量个数对拟合优度的影响的自由度,以剔除变量个数对拟合优度的影响:为什么以调整的为什么以调整的R2作为统计量可以避免片面增加解释作为统计量可以避免片面增加解释变量的倾向变量的倾向调整的可决系数调整的可决系数(adjustedcoefficientofdetermination)在样本容量一定的情况下,增加解释变量必定使得自由度减少,所以调整的思路是:将残差平方将残差平方和与总离差平方和分别除以各自的自由度,以剔和与总离差平方和分别除以各自的自由度,以剔除变量个数对拟
95、合优度的影响除变量个数对拟合优度的影响:其中:n-k-1为残差平方和的自由度,n-1为总体平方和的自由度。在应用软件中,可决系数在应用软件中,可决系数r2和调整的和调整的可可决系数决系数R2 2的计算是自动完成的的计算是自动完成的模型举例:电力消费模型模型举例:电力消费模型R R2 2=0.947=0.947调整的调整的R R2 2=0.934=0.934Dependent Variable: YMethod: Least SquaresDate: 11/18/08 Time: 11:45Sample: 2001 2011Included observations: 11VariableCoe
96、fficientStd. Errort-StatisticProb. C1941.837390.21944.9762690.0011X20.0935990.0093999.9579790X3-17.15073.701046-4.634010.0017R-squared0.946883 Mean dependent var320.0209Adjusted R-squared0.933603 S.D. dependent var140.1201S.E. of regression36.10549 Akaike info criterion10.23777Sum squared resid10428
97、.85 Schwarz criterion10.34628Log likelihood-53.3077 F-statistic71.30507Durbin-Watson stat2.182607 Prob(F-statistic)0.000008R R2 2多大才算通过了拟合优度检验?多大才算通过了拟合优度检验? 模型举例:电力消费模型模型举例:电力消费模型R R2 2=0.947=0.947调整的调整的R R2 2=0.934=0.934 1 1、总离差平方和的分解、总离差平方和的分解 已知由一组样本观测值(Xi,Yi),i=1,2,n得到如下样本回归直线如果Yi=i即实际观测值落在样本回归
98、“线”上,则拟合最好拟合最好。可认为,“离差”全部来自回归线,而与“残差”无关。对于所有样本点,则需考虑这些点与样本均值离差的平方和,可以证明:记总体平方和总体平方和(TotalSumofSquares)回归平方和回归平方和(ExplainedSumofSquares)残差平方和残差平方和(ResidualSumofSquares) TSS TSS为总体平方和,反应样本观测值总体离差的为总体平方和,反应样本观测值总体离差的大小;大小; ESS ESS为回归平方和,反应有模型中的解释变量所为回归平方和,反应有模型中的解释变量所解释的那部分离差的大小,样本回归线做出解释的解释的那部分离差的大小,样
99、本回归线做出解释的变差;变差; RSS RSS为残差平方和,反应样本观测值与估计值偏为残差平方和,反应样本观测值与估计值偏离的大小,也是模型中解释变量未做出解释的那部离的大小,也是模型中解释变量未做出解释的那部分离差的大小。分离差的大小。 既然既然残差平方和残差平方和ESSESS反映了样本观测值与估计值反映了样本观测值与估计值偏离的大小,可否直接用它作为拟合优度检验的统偏离的大小,可否直接用它作为拟合优度检验的统计量?计量? 不能,统计量必须是相对量不能,统计量必须是相对量TSSTSS、ESSESS、RSSRSS之间的关系之间的关系 TSS=ESS+RSS TSS=ESS+RSS 注意:注意:
100、TSS=ESS+RSSY的观测值围绕其均值的总离差总离差(totalvariation)可分解为两部分:一部分来自回归线一部分来自回归线(ESS),另一部,另一部分则来自随机势力分则来自随机势力(RSS)。在给定样本中,TSS不变,如果实际观测点离样本回归线越近,则ESS在TSS中占的比重越大,因此 拟合优度拟合优度:回归平方和:回归平方和ESS/YESS/Y的总离差的总离差TSSTSS2、可决系数、可决系数R2 2统计量统计量称R2为(样本)(样本)可决系数可决系数/判定系数判定系数(coefficientofdetermination)。可决系数可决系数的取值范围取值范围:0,1R2 2越
101、接近越接近1 1,说明实际观测点离样本线越近,拟,说明实际观测点离样本线越近,拟合优度越高合优度越高。模型与样本观测值完全拟合时R R2 2=1=1问题:要使得模型拟合得好,就要使得问题:要使得模型拟合得好,就要使得ESSESS增大增大 增加解释变量必定使得自由度减少增加解释变量必定使得自由度减少 在例2.1.1的收入收入-消费支出消费支出例中, 注:可决系数注:可决系数是一个非负的统计量。它也是随是一个非负的统计量。它也是随着抽样的不同而不同。为此,对可决系数的统计着抽样的不同而不同。为此,对可决系数的统计可靠性也应进行检验,这将在第可靠性也应进行检验,这将在第3章中进行。章中进行。由于=0
102、所以有:注意:注意:一个有趣的现象一个有趣的现象可决系数可决系数该统计量越接近于1,模型的拟合优度越高。 问题:问题: 在应用过程中发现,如果在模型中增加一个解释变量,R2往往增大(Why?)这就给人一个错觉一个错觉:要使得模型拟合得好,只要使得模型拟合得好,只要增加解释变量即可要增加解释变量即可。但是,现实情况往往是,由增加解释变量个数引起的R2的增大与拟合好坏无关,R2需调整需调整。调整的可决系数调整的可决系数(adjustedcoefficientofdetermination)在样本容量一定的情况下,增加解释变量必定使得自由度减少,所以调整的思路是:将残差平方将残差平方和与总离差平方和
103、分别除以各自的自由度,以剔和与总离差平方和分别除以各自的自由度,以剔除变量个数对拟合优度的影响除变量个数对拟合优度的影响:其中:n-k-1为残差平方和的自由度,n-1为总体平方和的自由度。*2、赤池信息准则和施瓦茨准则 为了比较所含解释变量个数不同的多元回归模型的拟为了比较所含解释变量个数不同的多元回归模型的拟合优度,常用的标准还有合优度,常用的标准还有: : 赤池信息准则(Akaikeinformationcriterion,AIC)施瓦茨准则施瓦茨准则(Schwarzcriterion,SC) 这两准则均要求这两准则均要求仅当所增加的解释变量能够减少仅当所增加的解释变量能够减少AICAIC
104、值或值或ACAC值时才在原模型中增加该解释变量值时才在原模型中增加该解释变量。Eviews的估计结果显示:中国居民消费一元例中:AIC=6.68AC=6.83中国居民消费二元例中:AIC=7.09AC=7.19从这点看,可以说前期人均居民消费CONSP(-1)应包括在模型中。 二、方程的显著性检验(F检验) 方程的显著性检验,旨在对模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立作出推断。用以进行方程显著性检验的方法主要有用以进行方程显著性检验的方法主要有三种,三种,F检验、检验、t检验、检验、r检验,他们的区别检验,他们的区别在于构造的统计量不同,即设计的在于构造的统计量不同,即
105、设计的“事件事件”不同不同应用最普遍的是F检验关于假设检验关于假设检验 1、假设检验是统计推断的一个主要内容,它假设检验是统计推断的一个主要内容,它的基本任务是根据样本说提供的信息,对未知总的基本任务是根据样本说提供的信息,对未知总体分布的某些方面的假设作出合理的判断。体分布的某些方面的假设作出合理的判断。 2 2、假设检验的程序是,先根据实际问题的要、假设检验的程序是,先根据实际问题的要求提出一个论断,成为统计假设,然后根据样本求提出一个论断,成为统计假设,然后根据样本的有关信息,对它的真伪进行判断,作出拒绝或的有关信息,对它的真伪进行判断,作出拒绝或者接受的决策者接受的决策 3 3、假设检
106、验的基本思想是概率性质的反证法。、假设检验的基本思想是概率性质的反证法。 4 4、概率性质的反证法的根据是、概率性质的反证法的根据是小概率事件小概率事件原原理,该理论认为理,该理论认为“小概率事件在一次试验中几乎小概率事件在一次试验中几乎是不可能发生的。是不可能发生的。” ” 二、方程的显著性检验(F检验) 1、方程显著性的、方程显著性的F检验检验F检验是要检验模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立即检验模型Yi=0+1X1i+2X2i+kXki+ii=1,2,n中的参数j是否显著不全为0。j=0,1,2, ,k可提出如下原假设与备择假设:H0:0=1=2=k=0H1:j
107、不全为0 F F检验的思想检验的思想来自于总离差平方和的分解式:TSS=ESS+RSS如果这个比值较大,则X的联合体对Y的解释程度高,可认为总体存在线性关系,反之总体上可能不存在线性关系。因此因此, ,可通过该比值的大小对总体线性关系进行推可通过该比值的大小对总体线性关系进行推断断。 根据数理统计学中的知识,在原假设H0成立的条件下,统计量服从自由度为(k,n-k-1)的F分布 给定显著性水平,可得到临界值F(k-1,n-k-1),由样本求出统计量F的数值,通过 FF(k,n-k-1) 或 FF(k,n-k-1)来拒绝或接受原假设H0,以判定原方程总体上总体上的线性关系是否显著成立。 对于电力
108、消费的例子:Y=1+2X2+3X3n=11,k=3,给定显著性水平=0.01,查分布表,查表得到临界值:F0.01(2, 8)=8.65 而通过样本计算的F统计量为F=71.3临界值8.65,所以该线性模型在0.99的水平下显著成立。 对于电力消费的例子,我们减少一个解释变量,仅用GDP来解释对电力消费的影响,看有什么不同:Y=1+2X2n=11,k=3,给定显著性水平=0.02,查分布表,查表得到临界值:F0.01(1, 9)=10.6 而通过样本计算的F统计量为F=36.99临界值10.6,所以该线性模型在0.99的水平下显著成立。但是当减少解释变量之后的一元模型,通过样本计算的F统计量为
109、F=36.99小于前面的二元模型的F统计量71.3,说明一元模型的回归方程对中离差作出解释的部分降低了Dependent Variable: YMethod: Least SquaresDate: 11/25/08 Time: 10:09Sample: 2001 2011Included observations: 11VariableCoefficientStd. Errort-StatisticProb. C1941.837390.21944.9762690.0011X20.0935990.0093999.9579790X3-17.15073.701046-4.634010.0017R-s
110、quared0.946883 Mean dependent var320.0209Adjusted R-squared0.933603 S.D. dependent var140.1201S.E. of regression36.10549 Akaike info criterion10.23777Sum squared resid10428.85 Schwarz criterion10.34628Log likelihood-53.3077 F-statistic71.30507Durbin-Watson stat2.182607 Prob(F-statistic)0.000008Depen
111、dent Variable: YMethod: Least SquaresDate: 11/25/08 Time: 10:03Sample: 2001 2011Included observations: 11VariableCoefficientStd. Errort-StatisticProb. C135.92236.116243.7634610.0045X20.1016640.0167166.0818820.0002R-squared0.804302 Mean dependent var320.0209Adjusted R-squared0.782558 S.D. dependent v
112、ar140.1201S.E. of regression65.33893 Akaike info criterion11.36002Sum squared resid38422.58 Schwarz criterion11.43236Log likelihood-60.4801 F-statistic36.98928Durbin-Watson stat1.930814 Prob(F-statistic)0.0001832、关于拟合优度检验与方程显著性检验关系的讨论关于拟合优度检验与方程显著性检验关系的讨论 在在电力消费的电力消费的二元模型二元模型中,中,在在电力消费的电力消费的一元模型一元模型
113、中中, 有许多著名的模型,有许多著名的模型,R R2 2小于小于0.50.5,支持了重要的,支持了重要的结论,利润收入差距的倒结论,利润收入差距的倒U U型规律型规律 不要片面追求拟合优度。不要片面追求拟合优度。 经典的计量模型经典的计量模型基尼系数基尼系数=1 1+2 2 (人均(人均GDPGDP)+ + 3 3 (人均(人均GDPGDP)2 2 经济发展水平经济发展水平收收入入差差距距收入差距和经济发展水平之间的关系收入差距和经济发展水平之间的关系他们存在倒他们存在倒U U型假设型假设 三、变量的显著性检验(三、变量的显著性检验(t检验)检验)对于多元线性回归模型,方程的对于多元线性回归模
114、型,方程的总体线性总体线性关系是显关系是显著的著的 每个解释变量每个解释变量对被解释变量的影响都是显著的对被解释变量的影响都是显著的因此,必须对每个解释变量进行显著性检验,因此,必须对每个解释变量进行显著性检验,以决定是否作为解释变量被保留在模型中。以决定是否作为解释变量被保留在模型中。变量显著性检验的数理统计学基础相同与方变量显著性检验的数理统计学基础相同与方程显著性检验,检验的思路也与方程显著性检验程显著性检验,检验的思路也与方程显著性检验相似相似 这一检验是由对变量的这一检验是由对变量的 t t 检验完成的。检验完成的。1、t统计量统计量由于由于 以以cjj表示矩阵表示矩阵(XX)-1主
115、对角线上的第主对角线上的第j个元素,个元素,于是参数估计量的方差为:于是参数估计量的方差为: 其中其中 2为随机误差项的方差,在实际计算为随机误差项的方差,在实际计算时,用它的估计量代替时,用它的估计量代替: :2、t检验检验 设计原假设与备择假设:H1:i0 给定一定显著性水平,可得到临界值t/2(n-k-1),由样本求出统计量t的数值,通过 |t|t/2(n-k-1) 或 |t|t/2(n-k-1)来拒绝或接受原假设H0,从而判定对应的解释变判定对应的解释变量是否应包括在模型中。量是否应包括在模型中。 H0:i=0(i=0,2k)在电电力力消消费费二二元元模模型型例中,由应用软件计算出参数
116、的t值:t1=4.9763,t2=9.9708,t3=-4.8132给定显著性水平=0.05,查得相应临界值:t0.025(8)=2.306。可见,计计算算的的所所有有t值值都都大大于于该该临临界界值值,所以拒绝原假设。即:包包括括常常数数项项在在内内的的3个个解解释释变变量量都都在在95%的的水水平下显著,都通过了变量显著性检验。平下显著,都通过了变量显著性检验。Dependent Variable: YMethod: Least SquaresDate: 11/25/08 Time: 10:09Sample: 2001 2011Included observations: 11Variab
117、leCoefficientStd. Errort-StatisticProb. C1941.837390.21944.9762690.0011X20.0935990.0093999.9579790X3-17.15073.701046-4.634010.0017R-squared0.946883 Mean dependent var320.0209Adjusted R-squared0.933603 S.D. dependent var140.1201S.E. of regression36.10549 Akaike info criterion10.23777Sum squared resid
118、10428.85 Schwarz criterion10.34628Log likelihood-53.3077 F-statistic71.30507Durbin-Watson stat2.182607 Prob(F-statistic)0.000008注意:注意:一元线性回归中,一元线性回归中,t t检验与检验与F F检验一致检验一致 一方面一方面,t检验与F检验都是对相同的原假设H0: 1=0=0 进行检验; 另一方面另一方面,两个统计量之间有如下关系:关于检验标准的判断关于检验标准的判断科学性科学性灵活性灵活性关键是讲清楚在什么置信水平下显著关键是讲清楚在什么置信水平下显著直观判断直观
119、判断 四、多元线性回归模型参数的区间估计四、多元线性回归模型参数的区间估计 (一)参数估计量的(一)参数估计量的区间估计区间估计(二)预测值的区间估计(二)预测值的区间估计(一)参数估计量的(一)参数估计量的区间估计区间估计1、问题的提出、问题的提出人人们们经经常常说说:“通通过过建建立立生生产产函函数数模模型型,得得到到资资本本的的产产出出弹弹性性是是0.5”,“通通过过建建立立消消费费模模型型,得得到到收收入入的的边边际际消消费费倾倾向向是是0.6”,等等等等,其其中中0.5或或者者0.6是模型具有特定经济含义的参数估计值。是模型具有特定经济含义的参数估计值。这样的说法是否正确?这样的说法
120、是否正确?应该如何表述呢?应该如何表述呢?(一)参数估计量的(一)参数估计量的区间估计区间估计线线性性回回归归模模型型的的参参数数估估计计值值是是随随机机变变量量,其其期期望望是是和和参参数数一一致致的的,利利用用一一次次抽抽样样得得到到的的样样本本观观测测值值估估计计出出来来的的参参数数估估计计值值不不一一定定就就等等于于参参数数实际值。只是参数的一个点估计实际值。只是参数的一个点估计如如果果用用参参数数估估计计量量的的一一个个点点估估计计值值近近似似代代表表参参数数值值,那那么么,二二者者的的接接近近程程度度如如何何?以以多多大大的的概概率达到该接近程度率达到该接近程度这这就就需需要要构构
121、造造参参数数的的一一个个区区间间,以以点点估估计计值值为为中中心心的的一一个个区区间间(称称为为置置信信区区间间),该该区区间间以以一定的概率(称为置信水平)包含该参数真实值。一定的概率(称为置信水平)包含该参数真实值。参参数数估估计计量量的的区区间间估估计计的的目目的的就就是是求求得得与与给给定置信水平定置信水平相对应的区间相对应的区间a。2、参数估计量的区间估计、参数估计量的区间估计 在消费模型中在消费模型中, ,Y=1+2X参数参数22的估计值为的估计值为0.530.53,标准差为,标准差为0.0220.022给定给定 =0.01=0.01,查表得临界值:,查表得临界值:t t0.005
122、0.005(8)(8)=3.355=3.355于是有P(0.53-3.3550.02222 0.53+3.3550.022 )=0.99P(0.45722 F0.05(9,9) 否定两组子样方差相同的假设,从而该总体随机项存在递增异方差性存在递增异方差性。(2 2)怀特检验)怀特检验作辅助回归:(-0.04)(0.10)(0.21)(-0.12)(1.47)(-1.11)R2=0.4638似乎没有哪个参数的t检验是显著的。但 nR2 =31*0.4638=14.38=5%下,临界值 20.05(5)=11.07,拒绝拒绝同方差性同方差性去掉交叉项后的辅助回归结果(1.36)(-0.64)(06
123、4)(-2.76)(2.90)R2=0.4374X2项与X2的平方项的参数的t检验是显著的,且nR2 =310.4374=13.56 =5%下,临界值 20.05(4)=9.49 拒绝拒绝同方差同方差的原假设的原假设 原模型的加权最小二乘回归原模型的加权最小二乘回归对原模型进行OLS估计,得到随机误差项的近似估计量i,以此构成权矩阵2W的估计量;再以1/|i|为权重进行WLS估计,得各项统计检验指标全面改善各项统计检验指标全面改善一、序列相关性概念二、序列相关性的后果三、序列相关性的检验四、具有序列相关性模型的估计4.2序列相关性序列相关性 一、序列相关性概念如果对于不同的样本点,随机误差项之
124、间不再如果对于不同的样本点,随机误差项之间不再是不相关的,而是存在某种相关性,则认为出现是不相关的,而是存在某种相关性,则认为出现了了序列相关性序列相关性。对于模型Yi=0+1X1i+2X2i+kXki+uii=1,2,n随机项互不相关的基本假设表现为Cov(ui,uj)=0ij,i,j=1,2,n或称为称为一阶自相关(autocorrelation)其中:被称为一一阶阶自自相相关关系系数数(first-ordercoefficientofautocorrelation)i是满足以下标准的OLS假定的随机干扰项:如果仅存在E(uiui+1)0i=1,2,n自相关自相关往往可写成如下形式:ui=
125、ui-1+i-11二、序列相关性产生的原因 大多数经济时间数据都有一个明显的特点:就是他的惯性惯性,表现在时间序列不同时间的前后关联性由于消费习惯消费习惯的影响被包含在随机误差项中,则可能出现序列相关性(往往是正相关 )。在这个模型当中,如果是截面数据,不同家庭之间的消费也有相关性,出现“攀比效应”例如,例如,绝对收入假设绝对收入假设下居民总消费函数模型居民总消费函数模型:Ct=0+1Yt+tt=1,2,n 1、经济变量固有的惯性 2、模型设定的偏误 所谓模型设定偏误设定偏误(Specificationerror)是指所设定的模型“不正确”。主要表现在模型中遗漏遗漏了重要的解释变量了重要的解释
126、变量或模型函数形式有偏误模型函数形式有偏误。 例如例如,对牛肉需求的模型本来应该为Yt=0+1X1t+2X2t+3X3t+ut其中:Y为需求量,X1为牛肉价格,X2为消费者收入,X3为猪肉价格(替代品)但在模型设定中做了下述回归:Yt=0+1X1t+1X2t+vt因此,vt=3X3t+ut,如果X3确实影响Y,则出现序列相关。但建模时设立了如下模型:但建模时设立了如下模型:Yt= 0+ 1Xt+vt因此,由于因此,由于vt= 2Xt2+ut,,包含了产出的平方对随机项,包含了产出的平方对随机项的系统性影响,随机项也呈现序列相关性。的系统性影响,随机项也呈现序列相关性。又如:模型本来是对数线性的
127、,你把它设成完又如:模型本来是对数线性的,你把它设成完全线性的,这也会产生自相关。全线性的,这也会产生自相关。又如:如果真实的边际成本回归模型应为:Yt=0+1Xt+2Xt2+ut其中:Y=边际成本,X=产出, 3、蛛网现象供给供给t=0+1价格t-1+ut农产品当期的供给t受前一期价格t-1的影响而价格t-1又受供给t-1的影响而供给t-1又和ut-1有关系使得ut和ut-1相关 例如,农产品供给对价格的反应本身存在一个滞后期:计量经济学模型一旦出现序列相关性,如果仍采用OLS法估计模型参数,会产生下列不良后果:二、序列相关性的后果二、序列相关性的后果 1 1、参数估计量非有效、参数估计量非
128、有效OSL参数估计量仍然是无偏的,但是不具有“有效性”因为,在有效性证明中利用了E(NN)=2I即同方差性和互相独立性条件。而且,在大样本情况下,参数估计量虽然具有一致参数估计量虽然具有一致性,但仍然不具有渐近有效性。性,但仍然不具有渐近有效性。2、变量的显著性检验失去意义 在变量的显著性检验中,统计量是建立在参数方在变量的显著性检验中,统计量是建立在参数方差正确估计基础之上的,这只有当随机误差项具有同差正确估计基础之上的,这只有当随机误差项具有同方差性和互相独立性时才能成立。方差性和互相独立性时才能成立。 其他检验也是如此。 3、模型的预测失效区间预测与参数估计量的方差有关,在方差有偏误的情
129、况下,使得预测估计不准确,预测精度降低。所以,当模型出现序列相关性时,它的预测功能失效。三、序列相关性的检验三、序列相关性的检验然后,通通过过分分析析这这些些“近似估计量”之之间间的的相相关关性,以判断随机误差项是否具有序列相关性。性,以判断随机误差项是否具有序列相关性。序列相关性序列相关性检验方法有多种,但基本思路相同:检验方法有多种,但基本思路相同: 基本思路基本思路: : 1、图示法2、杜宾-沃森(Durbin-Watson)检验法 D-W检验是杜宾(J.Durbin)和瓦森(G.S. Watson)于1951年提出的一种检验序列自相关的方法,该方法的假定条件是:(1)解释变量X非随机;
130、(2)随机误差项i为一阶自相关:i=i-1+i(3)回归模型中不应含有滞后应变量作为解释变量,即不应出现下列形式:Yi=0+1X1i+kXki+Yi-1+i(4)回归含有截距项该统计量该统计量的分布与出现在给定样本中的X值有复杂的关系,因此其精确的分布很难得到精确的分布很难得到。但是但是,他们成功地导出了临界值的下限dL和上限dU,且这些上下限只与样本的容量n和解释变量的个数k有关,而与解释变量X的取值无关。 杜宾和瓦森针对原假设:H0:=0,即不存在一阶自回归,构如下造统计量:D.W.统计量统计量:D.W检验步骤检验步骤:(1)计算DW值(2)给定,由n和k的大小查DW分布表,得临界值dL和
131、dU(3)根据DW检验规则,判断是否具有自相关若0D.W.dL存在正自相关dLD.W.dU不能确定dUD.W.4dU无自相关4dUD.W.4dL不能确定4dLD.W.4存在负自相关0dLdU24-dU4-dL正相关不能确定无自相关不能确定负相关 DW值与值与值之间的关系值之间的关系得到DWDW=2=2(1-1-) 为相关系数为相关系数如果存在如果存在完全一阶正相关完全一阶正相关,即,即 =1,则,则DW 0完全一阶负相关完全一阶负相关,即,即 =-1,则则DW 4完全不相关完全不相关,即即 =0,则,则DW 2*注意注意(1)从从判判断断准准则则看看到到,DW检检验验存存在在一一个个不不能能确
132、确定的定的DW值区域,这是值区域,这是DW检验的一大缺陷;检验的一大缺陷;(2)DW检检验验虽虽然然只只能能检检验验一一阶阶自自相相关关,但但是是在在实实际际计计量量经经济济学学问问题题当当中中,一一阶阶自自相相关关是是出出现现得得最最多的一类序列相关。多的一类序列相关。(3)经经验验表表明明,如如果果不不存存在在一一阶阶自自相相关关,一一般般也也不存在高阶序列相关。不存在高阶序列相关。如果模型被检验证明存在序列相关性,则需如果模型被检验证明存在序列相关性,则需要发展新的方法估计模型。要发展新的方法估计模型。最常用的方法是广义差分法广义差分法(GeneralizedDifference)。四、
133、序列相关的补救四、序列相关的补救 广义差分法广义差分法是是将将原原模模型型变变换换为为满满足足OLS法法的的差差分分模模型,再进行型,再进行OLS估计。估计。如果原模型如果存在可以将原模型变换为:Yt=1+2Xt+utut=ut-1+vtYt-Yt-1=1(1-)+2( Xt-Xt-1)+ut-ut-1该模型为广义差分模型广义差分模型,由于ut-ut-1=vt , vt不存在序列相关问题,该差分模型满足OSL法的基本假设。可进行OLSOLS估计,得到的参数为无偏的,有效的估计量。 广义差分法问题的关键是要找出式子当中的在Eviews当中可以生产et序列,得到et=et-1ut=ut-1+vtY
134、t-Yt-1=1(1-)+2( Xt-Xt-1)+ut-ut-1然后在用广义差分模型进行估计:(1)科克伦-奥科特迭代法。以一元线性模型为例:首先首先,采用OLS法估计原模型Yi=0+1Xi+i得到的的“近似估计值”,并以之作为观测值使用OLS法估计下式i=1i-1+2i-2+Li-L+i求出i新的“近拟估计值”,并以之作为样本观测值,再次估计i=1i-1+2i-2+Li-L+i 类似地,可进行第三次、第四次迭代。关于迭代的次数,可根据具体的问题来定。关于迭代的次数,可根据具体的问题来定。一一般般是是事事先先给给出出一一个个精精度度,当当相相邻邻两两次次 1, 2, L的估计值之差小于这一精度
135、时,迭代终止。的估计值之差小于这一精度时,迭代终止。实实践践中中,有有时时只只要要迭迭代代两两次次,就就可可得得到到较较满满意意的的结果。两次迭代过程也被称为结果。两次迭代过程也被称为科克伦-奥科特两步法。(2)杜宾)杜宾(durbin)两步法两步法该方法仍是先估计该方法仍是先估计 1, 2, l,再对差分,再对差分模型进行估计模型进行估计第一步第一步,变换差分模型为下列形式进行OLS估计,得各Yj(j=i-1,i-2,i-l)前的系数1,2,l的估计值应用软件中的广义差分法在Eview/TSP软件包下,广义差分采用了科克伦-奥科特(Cochrane-Orcutt)迭代法估计。 在解释变量中引
136、入AR(1)、AR(2)、,即可得到参数和1、2、的估计值。其中AR(m)表示随机误差项的m阶自回归。在估计过程中自动完成了1、2、的迭代。n如果能够找到一种方法,求得或各序列相关系数 j j的估计量,使得GLS能够实现,则称为可行的广义最小二乘法(FGLS,FeasibleGeneralizedLeastSquares)。nFGLS估计量,也称为可行的广义最小二乘估计量(feasiblegeneralleastsquaresestimators)n可行的广义最小二乘估计量不再是无偏的,但却是一致的,而且在科克伦-奥科特迭代法下,估计量也具有渐近有效性。n前面提出的方法,就是FGLS注意:注意
137、:4、虚假序列相关问题由于随机项的序列相关往往是在模型设定中遗漏了重要的解释变量或对模型的函数形式设定有误,这种情形可称为虚假序列相关(falseautocorrelation),应在模型设定中排除。避免产生虚假序列相关性的措施是在开始时建立一个“一般”的模型,然后逐渐剔除确实不显著的变量。五、案例:中国商品进口模型 经济理论指出,商品进口商品进口主要由进口国的经经济发展水平济发展水平,以及商品进口价格指数商品进口价格指数与国内价格国内价格指数指数对比因素决定的。 由于无法取得中国商品进口价格指数,我们主要研究中国商品进口与国内生产总值的关系。(下表)。1.通过OLS法建立如下中国商品进口方程
138、: (2.32) (20.12)2.进行序列相关性检验。DW检验取=5%,由于n=24,k=2(包含常数项),查表得: dl=1.27, du=1.45由于 DW=0.62820.05(2)故: 存在正自相关存在正自相关2 2阶滞后:阶滞后:3阶滞后:(0.22)(-0.497)(4.541)(-1.842)(0.087)R2=0.6615于是,LM=210.6614=13.89取=5%,2分布的临界值20.05(3)=7.815LM20.05(3)表明: 存在正自相关;但存在正自相关;但 t-3t-3的参数不显著,说的参数不显著,说明不存在明不存在3 3阶序列相关性。阶序列相关性。3、运用广
139、义差分法进行自相关的处理、运用广义差分法进行自相关的处理(1)采用杜宾两步法估计)采用杜宾两步法估计 第一步第一步,估计模型(1.76)(6.64)(-1.76)(5.88)(-5.19)(5.30)第二步第二步,作差分变换:则M*关于GDP*的OLS估计结果为: (2.76)(16.46)取=5%,DWdu=1.43(样本容量24-2=22)表明:已不存在自相关于是原模型为:与与OLS估计结果的差别只在估计结果的差别只在截距项截距项:(2)采用科克伦-奥科特迭代法估计 在Eviews软包下,2阶广义差分的结果为:取=5% ,DWdu=1.66(样本容量:22)表明:广义差分模型已不存在序列相
140、关性。(3.81)(18.45)(6.11)(-3.61) 可以验证可以验证: : 仅采用1阶广义差分,变换后的模型仍存在1阶自相关性; 采用3阶广义差分,变换后的模型不再有自相关性,但AR3的系数的t值不显著。n一、多重共线性的概念n二、多重共线性的后果n三、多重共线性的检验n四、克服多重共线性的方法4.3 4.3 多重共线性多重共线性一、多重共线性的概念对于模型对于模型Yi= 0+ 1X1i+ 2X2i+ kXki+ ii=1,2,n其基本假设之一是解释变量是互相独立的。其基本假设之一是解释变量是互相独立的。如果某两个或多个解释变量之间出现了相如果某两个或多个解释变量之间出现了相关性,则称
141、为关性,则称为多重共线性多重共线性(Multicollinearity)。如果存在如果存在c1X1i+c2X2i+ckXki=0i=1,2,n其其中中:ci不不全全为为0,即即至至少少有有一一个个解解释释变变量量可可以以用用其其他他解解释释变变量量的的线线性性组组合合来来表表示示,则称为解释变量间存在完全共线性(perfectmulticollinearity)。如果存在c1X1i+c2X2i+ckXki+vi=0i=1,2,n其中ci不全为0,vi为随机误差项,则称为近近似似共共线线性性(approximatemulticollinearity) 在矩阵表示的线性回归模型在矩阵表示的线性回归
142、模型 Y=X+中,中,完全共线性指:秩(X)k,即,即中,至少有一列向量可由其他列向量线性表出。如:X2=X1,X2和X1完全相关,相关系数为1或-1,则解释变量X2对被解释变量Y的作用可由X1代替 。注意:完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,即近似共线性。二、实际经济问题中的多重共线性一一般般地地,产产生生多多重重共共线线性性的的主主要要原原因因有有以以下下三三个个方面:方面:(1)经济变量相关的共同趋势 时间序列样本:时间序列样本:经济经济繁荣时期繁荣时期,各基本经济变量,各基本经济变量(收入、消费、投资、价格)都趋于增长;(收入、消费、投资、价格)都趋于增长;衰退
143、时衰退时期期,又同时趋于下降。,又同时趋于下降。横截面数据横截面数据:生产函数中生产函数中,资本投入与劳动力投资本投入与劳动力投入往往出现高度相关情况,大企业二者都大,小企入往往出现高度相关情况,大企业二者都大,小企业都小。业都小。 (2)滞后变量的引入在经济计量模型中,往往需要引入滞后经济在经济计量模型中,往往需要引入滞后经济变量来反映真实的经济关系。变量来反映真实的经济关系。例如例如,消费,消费=f(当期收入当期收入,前期收入)前期收入)显然,两期收入间有较强的线性相关性。显然,两期收入间有较强的线性相关性。GDPt=GDPt-1(1+增长率)增长率) (3)样本资料的限制由于完全符合理论
144、模型所要求的样本数据较由于完全符合理论模型所要求的样本数据较难收集,或者样本容量较小,特定样本可能存在难收集,或者样本容量较小,特定样本可能存在某种程度的多重共线性。某种程度的多重共线性。一般经验:时间序列数据样本:简单线性模型,往往存样本:简单线性模型,往往存在多重共线性。在多重共线性。截面数据样本:问题不那么严重,但多重共样本:问题不那么严重,但多重共线性仍然是存在的。线性仍然是存在的。二、多重共线性的后果 1 1、完全共线性下参数估计量不存在、完全共线性下参数估计量不存在如果存在如果存在完全共线性完全共线性,则,则(XX)-1不存在,无法得到不存在,无法得到参数的估计量。参数的估计量。的
145、OLS估计量为:例:例:对离差形式的二元回归模型如果两个解释变量完全相关,如x2=x1,则这时,只能确定综合参数1+2的估计值: 2、近似共线性下OLS估计量非有效近似共线性下,可以得到近似共线性下,可以得到OLS参数估计量,参数估计量,但参数估计量但参数估计量方差的表达式为的表达式为由于|XX|0,引起(XX)-1主对角线元素较大,使参数估计值的方差Var(j)=2cjj增大,OLS参数估计量非有效。参数估计量非有效。(XX)-1=1/(XX)仍以二元线性模型 y=1x1+2x2+ 为例:恰为X1与X2的线性相关系数的平方r2由于r21,故1/(1-r2)1如果存在多重共线性,这些解释变量X
146、2与X3前面的系数已经失去了应有的经济含义 若L=2K,L和K完全相关比较以下两个个式子,看是否等价例如:根据某一样本估计出二元生产函数多多重共线性使参数估计值的方差增大,1/(1-r2)为为方差膨胀因子(VarianceInflationFactor,VIF)当完全不共线完全不共线时,r2=0当近似共线近似共线时,0r215.19,故认上述粮食生产的总体线性关系显著成立。故认上述粮食生产的总体线性关系显著成立。但但X4、X5的参数未通过的参数未通过t检验,且符号不正确,故检验,且符号不正确,故解释变量间可能存在多重共线性。(-0.91)(8.39)(3.32)(-2.81)(-1.45)(-
147、0.14) 2、检验简单相关系数n发现:X1与与X4间存在高度相关性。间存在高度相关性。列出X1,X2,X3,X4,X5的相关系数矩阵: 3、找出最简单的回归形式n可见,应选第1个式子为初始的回归模型。分别作Y与X1,X2,X4,X5间的回归:(25.58)(11.49)R2=0.8919F=132.1DW=1.56(-0.49)(1.14)R2=0.075F=1.30DW=0.12(17.45)(6.68)R2=0.7527F=48.7DW=1.11(-1.04)(2.66)R2=0.3064F=7.07DW=0.36 4、逐步回归 将将其其他他解解释释变变量量分分别别导导入入上上述述初初始
148、始回回归归模模型型,寻寻找找最佳回归方程。最佳回归方程。 回归方程以Y=f(X1,X2,X3)为最优: 5 5、结论、结论*七、分部回归与多重共线性1、分部回归法(Partitioned Regression)对于模型对于模型在满足解释变量与随机误差项不相关的情况下,可以写出关于参数估计量的方程组:将解释变量分为两部分,对应的参数也分为两部分:如果存在如果存在X1与与X2完全正交完全正交则有同样有这就是仅以这就是仅以X X2 2作为解释变量时的参数估计量作为解释变量时的参数估计量。这就是仅以这就是仅以X X1 1作为解释变量时的参数估计量作为解释变量时的参数估计量2、由分部回归法导出n如果一个
149、多元线性模型的解释变量之间完全正交,可以将该多元模型分为多个一元模型、二元模型、进行估计,参数估计结果不变;n实际模型由于存在或轻或重的共线性,如果将它们分为多个一元模型、二元模型、进行估计,参数估计结果将发生变化;n严格地说,实际模型由于总存在一定程度的共线性,所以每个参数估计量并不真正反映对应变量与被解释变量之间的结构关系。当模型存在共线性,将某个共线性变量去当模型存在共线性,将某个共线性变量去掉,剩余变量的参数估计结果将发生变化,掉,剩余变量的参数估计结果将发生变化,而且经济含义有发生变化;而且经济含义有发生变化;4.4 随机解释变量问题随机解释变量问题对于模型对于模型Yi= 0+ 1X
150、1i+ 2X2i+ kXki+ ii=1,2,n其基本假设之一是解释变量为确定性变量。其基本假设之一是解释变量为确定性变量。如果存在一个或多个解释变量是随机变量,如果存在一个或多个解释变量是随机变量,则称模型存在随机解释变量问题则称模型存在随机解释变量问题三种情况三种情况n1、随机解释变量与随机干扰项独立、随机解释变量与随机干扰项独立n2、随机解释变量与随机干扰项同期无关但异期、随机解释变量与随机干扰项同期无关但异期相关相关n3、随机解释变量与随机干扰项同期相关、随机解释变量与随机干扰项同期相关二、随机解释变量的后果二、随机解释变量的后果n1、随机解释变量与随机干扰项独立、随机解释变量与随机干
151、扰项独立参数估计量仍是无偏一致估计量参数估计量仍是无偏一致估计量n2、随机解释变量与随机干扰项同期无关但异期、随机解释变量与随机干扰项同期无关但异期相关相关参数估计量有偏,但却是一致估计量参数估计量有偏,但却是一致估计量n3、随机解释变量与随机干扰项同期相关、随机解释变量与随机干扰项同期相关参数估计量有偏且非一致参数估计量有偏且非一致三、随机解释变量的补救三、随机解释变量的补救(略略)n工具变量法工具变量法第七章 滞后变量模型 一、滞后变量模型二、分布滞后模型的参数估计三、自回归模型的参数估计四、格兰杰因果关系检验2013年1月516在在经经济济运运行行过过程程中中,广广泛泛存存在在时时间间滞
152、滞后后效效应应。某某些些经经济济变变量量不不仅仅受受到到同同期期各各种种因因素素的的影影响响,而而且且也也受受到到过去某些时期的各种因素甚至自身的过去值的影响。过去某些时期的各种因素甚至自身的过去值的影响。通通常常把把这这种种过过去去时时期期的的,具具有有滞滞后后作作用用的的变变量量叫叫做做滞滞后后变变量量(LaggedVariable),含有滞后变量的模型称为滞后变量模型滞后变量模型。滞后变量模型考虑了时间因素的作用,使静态分析的问题有可能成为动态分析。含含有有滞滞后后解解释释变变量的模型,又称量的模型,又称动态模型动态模型(DynamicalModel)。一、滞后变量模型一、滞后变量模型1
153、、滞后效应与与产生滞后效应的原因、滞后效应与与产生滞后效应的原因因变量受到自身或另一解释变量的前几期值影响的现象称为滞后效应。表示前几期值的变量称为滞后变量。如:消费函数通通常常认认为为,本本期期的的消消费费除除了了受受本本期期的的收收入入影影响响之之外,还受前外,还受前1期,或前期,或前2期收入的影响:期收入的影响:Ct= 0+ 1Yt+ 2Yt-1+ 3Yt-2+ tYt-1,Yt-2为为滞后变量。 产生滞后效应的原因产生滞后效应的原因 1、心理因素:人人们们的的心心理理定定势势,行行为为方方式式滞后于经济形势的变化,惯性思维。座位。滞后于经济形势的变化,惯性思维。座位。2、技术原因:如如
154、当当年年的的产产出出在在某某种种程程度度上上依赖于过去若干期内投资形成的固定资产。依赖于过去若干期内投资形成的固定资产。3、制度原因: 民族习俗,男女平等民族习俗,男女平等。2、滞后变量模型 以滞后变量作为解释变量,就得到以滞后变量作为解释变量,就得到滞后变量模型。它的一般形式为:它的一般形式为:q,s:滞后时间间隔 自自回回归归分分布布滞滞后后模模型型(autoregressivedistributedlagmodel,ADL):既含有Y对自身滞后变量的回归,还包括着X分布在不同时期的滞后变量有限自回归分布滞后模型:有限自回归分布滞后模型:滞后期长度有限 无限自回归分布滞后模型:无限自回归分
155、布滞后模型:滞后期无限,(1)分布滞后模型(distributed-lagmodel) 分布滞后模型:模型中没有滞后被解释变量,仅模型中没有滞后被解释变量,仅有解释变量有解释变量X X的当期值及其若干期的滞后值:的当期值及其若干期的滞后值:0:短短期期(short-run)或即即期期乘乘数数(impactmultiplier),表示本期X变化一单位对Y平均值的影响程度。 i (i=1,2,s):动态乘数动态乘数或延迟系数延迟系数,表示各滞后期X的变动对Y平均值影响的大小。 如如果果各各期期的的X值值保保持持不不变变,则则X与与Y间间的的长长期期或均衡关系即为或均衡关系即为称为长期长期(long
156、-run)或均衡乘数均衡乘数(totaldistributed-lagmultiplier),表示X变动一个单位,由于滞后效应而形成的对Y平均值总影响的大小。 2、自回归模型(autoregressive model)而称为一阶自回归模型(一阶自回归模型(first-orderautoregressivemodel)。自回归模型自回归模型:模型中的解释变量仅包含X的当期值与被解释变量Y的一个或多个滞后值n1、下面关于内生变量的表述,错误的是(D)A内生变量都是随机变量B内生变量受模型中其它内生变量的影响,同时又影响其它内生变量C在单方程结构式方程中,解释变量可以是前定变量,也可以是内生变量D滞
157、后内生变量与内生变量具有相同性质n2、在单方程结构式模型中,其解释变量(A)nA都是前定变量B都是内生变量C可以既有内生变量又有前定变量D都是外生变量n注:经济变量分为内生变量和外生变量注:经济变量分为内生变量和外生变量n内生变量的数值是由模型决定。内生变量的数值是由模型决定。滞后内生变量(又称前定内生变量)是过去时滞后内生变量(又称前定内生变量)是过去时期的内生变量。期的内生变量。n外生变量是其数值由模型以外决定的变量。外生变量是其数值由模型以外决定的变量。n滞后内生变量和外生变量一起成为滞后内生变量和外生变量一起成为前定变量前定变量,在单方,在单方程模型中,程模型中,前定变量一般作为解释变
158、量前定变量一般作为解释变量;内生变量作为;内生变量作为被解释变量。而在联立方程模型中,内生变量既可作为被解释变量。而在联立方程模型中,内生变量既可作为被解释变量,也可作为解释变量被解释变量,也可作为解释变量n例如:分布滞后模型例如:分布滞后模型消费消费=1+2GDP+GDPt-1n自回归模型自回归模型消费消费=1+2GDP+3消费消费t-1二、分布滞后模型的参数估计 无限期的分布滞后模型,由于样本观测值的有限性,使得无法直接对其进行估计。 有限期的分布滞后模型,OLS会遇到如下问题:1、没有先验准则确定滞后期长度;、没有先验准则确定滞后期长度;2、如如果果滞滞后后期期较较长长,将将缺缺乏乏足足
159、够够的的自自由由度度进进行行估估计和检验;计和检验; 3 3、同名变量滞后值之间可能存在高度线性相关,、同名变量滞后值之间可能存在高度线性相关,即模型存在高度的多重共线性。即模型存在高度的多重共线性。1、分布滞后模型估计的困难、分布滞后模型估计的困难2、分布滞后模型的修正估计方法 人人们们提提出出了了一一系系列列的的修修正正估估计计方方法法,但但并并不不很很完完善。善。各种方法的基本思想大致相同:都都是是通过对各滞后变量加权,组成线性合成变量而有目的地减少滞后变量的数目,以缓解多重共线性,保证自由度。(1)经验加权法根根据据实实际际问问题题的的特特点点、实实际际经经验验给给各各滞滞后后变变量量
160、指指定定权权数数,滞滞后后变变量量按按权权数数线线性性组组合合,构构成成新新的的变变量量。权数据的类型有:权数据的类型有:递减型递减型:即认为权权数数是是递递减减的的,X的近期值对Y的影响较远期值大。如消费函数中,收入的近期值对消费的影响作用显然大于远期值的影响。例如:滞后期为滞后期为3的一组权数可取值如下:1/2,1/4,1/6,1/8则新的线性组合变量为: 即认为权权数数是是相相等等的的,X的逐期滞后值对值Y的影响相同。 如滞后期为3,指定相等权数为1/41/4,则新的线性组合变量为: 矩型矩型:权数先递增后递减权数先递增后递减呈倒“V”型。例例如如:在一个较长建设周期的投资中,历年投资X
161、为产出Y的影响,往往在周期期中投资对本期产出贡献最大。如滞后期为4,权数可取为1/6,1/4,1/2,1/3,1/5则新变量为 倒倒V V型型例例5.2.1 5.2.1 对一个分布滞后模型:给定递减权数:1/2, 1/4, 1/6, 1/8令原模型变为:该模型可用OLS法估计。假如参数估计结果为=0.5=0.8则原模型的估计结果为: 经验权数法经验权数法的优点优点是:简单易行 缺点缺点是:设置权数的随意性较大 通常的做法通常的做法是: 多选几组权数,分别估计出几个模型,然后根据常用的统计检验(方检验,检验,t检验,-检验),从中选择最佳估计式。(2)阿尔蒙()阿尔蒙(lmon)多项式法)多项式
162、法 主要思想:主要思想:针对有限滞后期模型,通过阿尔蒙针对有限滞后期模型,通过阿尔蒙变换,定义新变量,以减少解释变量个数,然后变换,定义新变量,以减少解释变量个数,然后用用OLSOLS法估计参数。法估计参数。 主要步骤为:主要步骤为: 第一步,阿尔蒙变换第一步,阿尔蒙变换 对于分布滞后模型 假定其回归系数i可用一个关于滞后期i的适当阶数的多项式来表示,即:i=0,1,s其中,ms-1。阿尔蒙变换要求先验地确定适当阶数k,例如取k=2,得(*) 将(*)代入分布滞后模型得定义新变量将原模型转换为:第二步,模型的第二步,模型的OLS估计估计 对变换后的模型进行OLS估计,得再计算出:求出滞后分布模
163、型参数的估计值: 由于m+1s,可以认为原模型存在的自由度不足和多重共线性问题已得到改善。 需注意的是需注意的是,在实际估计中,阿尔蒙多项式的阶数m一般取2或3,不超过4,否则达不到减少变量个数的目的。例例5.2.2表5.2.1给出了中国电力基本建设投资电力基本建设投资X与发电量发电量Y的相关资料,拟建立一多项式分布滞后模型来考察两者的关系。由于无法预见知电力行业基本建设投资对发电量影响的时滞期,需取不同的滞后期试算。 (13.62)(1.86) (0.15) (-0.67)求得的分布滞后模型参数估计值为经过试算发现,在2阶阿尔蒙多项式变换下,滞后期数取到第6期,估计结果的经济意义比较合理。2
164、阶阿尔蒙多项式估计结果如下:为了比较,下面给出直接对滞后6期的模型进行OLS估计的结果:最后得到分布滞后模型估计式为:(3)科伊克()科伊克(Koyck)方法)方法 科伊克方法是将无限分布滞后模型转换为自回科伊克方法是将无限分布滞后模型转换为自回归模型,然后进行估计归模型,然后进行估计。 对于无限分布滞后模型:科伊克变换假设科伊克变换假设i随滞后期i按几何级数衰减: 其中,0F(m,n-k) ,则拒绝原假设,认为X X是是Y Y的格兰杰原因的格兰杰原因。注意:注意: 格兰杰因果关系检验格兰杰因果关系检验对于滞后期长度的选择有时很敏感。不同的滞后期可能会得到完全不同的检验结果。 因此,一般而言一
165、般而言,常进行不同滞后期长度的检验,以检验模型中随机误差项不存在序列相关的滞后期长度来选取滞后期。例例5.2.4检验19782000年间中国当年价GDP与居民消费CONS的因果关系。取两阶滞后,Eviews给出的估计结果为:判断:=5%,临界值F0.05(2,17)=3.59拒绝“GDP不是CONS的格兰杰原因”的假设,不拒绝“CONS不是GDP的格兰杰原因”的假设。因此,从2阶滞后的情况看,GDP的增长是居民消费增长的原因,而不是相反。但在2阶滞后时,检验的模型存在1阶自相关性。随随着着滞滞后后阶阶数数的的增增加加,拒拒绝绝“GDP是是居居民民消消费费CONS的的原原因因”的的概概率率变变大
166、大,而而拒拒绝绝“居居民民消消费费CONS是是GDP的原因的原因”的概率变小。的概率变小。如如果果同同时时考考虑虑检检验验模模型型的的序序列列相相关关性性以以及及赤赤池池信信息息准准则则,发发现现:滞后4阶或5阶的检验模型不具有1阶自相关性,而且也拥有较小的AIC值,这这时时判断结果是是:GDP与CONS有双向的格兰杰因果关系,即相互影响。分析:分析:第八章第八章 虚拟变量回归虚拟变量回归2013年1月5665.1虚拟变量模型一、虚拟变量的基本含义二、虚拟变量的引入三、虚拟变量的设置原则2013年1月567一、虚拟变量的基本含义n许多经济变量是许多经济变量是可以定量度量的,的,如:商品需求量、
167、商品需求量、价格、收入、产量等价格、收入、产量等n但也有一些影响经济变量的因素但也有一些影响经济变量的因素无法定量度量,如:职业、性别对收入的影响,战争、自然灾害对职业、性别对收入的影响,战争、自然灾害对GDP的的影响,季节对某些产品(如冷饮)销售的影响等等。影响,季节对某些产品(如冷饮)销售的影响等等。n为了在模型中能够反映这些因素的影响,并提高模型为了在模型中能够反映这些因素的影响,并提高模型的精度,需要将它们的精度,需要将它们“量化量化”,n这时候可以用这时候可以用0-1变量来进行量化分析,用变量来进行量化分析,用1表表示具有某一示具有某一“品质品质”或属性,用或属性,用0表示不具有该表
168、示不具有该“品质品质”或属性,这种的变量为虚拟变量。或属性,这种的变量为虚拟变量。 这种这种“量化量化”通常是通过引入通常是通过引入“虚拟变量虚拟变量”来完成的。根据来完成的。根据这些因素的属性类型,构造只取这些因素的属性类型,构造只取“0”或或“1”的人工变量,通常的人工变量,通常称为称为虚拟变量(dummyvariables),记为),记为D。n例如,反映文程度的虚拟变量可取为:1,本科学历本科学历D=0,非本科学历非本科学历一般地,在虚拟变量的设置中:基础类型、肯定类型取值为基础类型、肯定类型取值为1;比较类型,否定类型取值为比较类型,否定类型取值为0。概念:同时含有一般解释变量与虚拟变
169、量的模型称为虚拟变量模型或者方差分析(analysis-ofvariance:ANOVA)模型。一个以性别为虚拟变量考察企业职工薪金的模型:一个以性别为虚拟变量考察企业职工薪金的模型:其中:Yi为企业职工的薪金,Xi为工龄,Di=1,若是男性,Di=0,若是女性。n虚拟变量虚拟变量n许多经济变量是可以定量度量的,如价格、收入、许多经济变量是可以定量度量的,如价格、收入、产量等;但也有一些影响经济变量的因素无法定产量等;但也有一些影响经济变量的因素无法定量度量,如性别对收入的影响,改革开放对量度量,如性别对收入的影响,改革开放对GDP的影响的影响n这时候可以用这时候可以用0-1变量来表示,用变量
170、来表示,用1表示具有某一表示具有某一“品质品质”或属性,用或属性,用0表示不具有该表示不具有该“品质品质”或属性,或属性,这种变量称之为虚拟变量或哑变量。这种变量称之为虚拟变量或哑变量。二、虚拟变量的引入n虚拟变量做为解释变量引入模型有两种基本方式:虚拟变量做为解释变量引入模型有两种基本方式:加法方式和和乘法方式。企业男职工的平均薪金为:企业男职工的平均薪金为:上述企业职工薪金模型中性别虚拟变量的引入采取了加法方式。在该模型中,如果仍假定E(i)=0,则企业女职工的平均薪金为:企业女职工的平均薪金为: 1 1、加法方式、加法方式几何意义:n假定假定 20,则两个函数有相同的斜率,但有不同的截,
171、则两个函数有相同的斜率,但有不同的截距。意即,男女职工平均薪金对教龄的变化率是一样距。意即,男女职工平均薪金对教龄的变化率是一样的,但两者的平均薪金水平相差的,但两者的平均薪金水平相差 2。n可以通过传统的回归检验,对可以通过传统的回归检验,对 2的统计显著性进行检的统计显著性进行检验,以判断企业男女职工的平均薪金水平是否有显著验,以判断企业男女职工的平均薪金水平是否有显著差异。差异。02 又例:在横截面数据基础上,考虑个人保健支出:在横截面数据基础上,考虑个人保健支出对个人收入和教育水平的回归。对个人收入和教育水平的回归。教育水平考虑三个层次:高中以下,教育水平考虑三个层次:高中以下,高中,
172、高中,大学及其以上大学及其以上模型可设定如下:这时需要引入两个虚拟变量: 在在E( i)=0 的初始假定下,高中以下、高中、大学的初始假定下,高中以下、高中、大学及其以上教育水平下个人保健支出的函数:及其以上教育水平下个人保健支出的函数:n高中以下:高中以下:高中:大学及其以上:假定32,其几何意义:还可将多个虚拟变量引入模型中以考察多种“定性”因素的影响。如在在上上述述职职工工薪薪金金的的例例中中,再再引引入入代代表表学学历历的的虚虚拟拟变变量量D2:本科及以上学历本科以下学历职工薪金的回归模型可设计为:女职工本科以下学历的平均薪金:女职工本科以上学历的平均薪金:于是,不同性别、不同学历职工
173、的平均薪金分别为:男职工本科以下学历的平均薪金:男职工本科以上学历的平均薪金: 2、乘法方式n加法方式引入虚拟变量,考察:加法方式引入虚拟变量,考察:截距的不同,n许多情况下:往往是斜率就有变化,许多情况下:往往是斜率就有变化,或斜率、截距同时发生变化。n斜率的变化可通过以乘法的方式引入虚拟变量来测度。例例:根据消费理论,消费水平C主要取决于收入水平Y,但在一个较长的时期,人们的消费倾向会发生变化,尤其是在自然灾害、战争等反常年份,消费倾向往往出现变化。这种消费倾向的变化可通过在收入的系数中引入虚拟变量来考察。n这里,虚拟变量这里,虚拟变量D以与以与X相乘的方式引入了模型中,相乘的方式引入了模
174、型中,从而可用来考察消费倾向的变化。从而可用来考察消费倾向的变化。n假定假定E( i)=0,上述模型所表示的函数可化为:上述模型所表示的函数可化为:正常年份:反常年份:如,设消费模型可建立如下:当截距与斜率发生变化时,则需要同时引入加法与乘法形式的虚拟变量。n例5.1.1,考考察察1990年年前前后后的的中中国国居居民民的的总总储储蓄蓄-收收入入关关系是否已发生变化。系是否已发生变化。表表5.1.1中中给给出出了了中中国国19792001年年以以城城乡乡储储蓄蓄存存款款余余额代表的居民储蓄以及以额代表的居民储蓄以及以GNP代表的居民收入的数据。代表的居民收入的数据。 以以Y为储蓄,为储蓄,X为
175、收入,可令:为收入,可令:n1990年前:年前:Yi= 1+ 2Xi+ 1ii=1,2,n1n1990年后:年后:Yi= 1+ 2Xi+ 2ii=1,2,n2则有可能出现下述四种情况中的一种:则有可能出现下述四种情况中的一种:(1) 1= 1,且且 2= 2,即即两两个个回回归归相相同同,称称为为重合回归(CoincidentRegressions););(2) 11,但但 2= 2,即即两两个个回回归归的的差差异异仅仅在在其其截截距距,称称为为平行回归(ParallelRegressions);(3) 1= 1,但但 22,即即两两个个回回归归的的差差异异仅仅在在其其斜斜率率,称为称为汇合回
176、归(ConcurrentRegressions);(4) 11,且且 22,即即两两个个回回归归完完全全不不同同,称称为为相异回归(DissimilarRegressions)。)。 可以运用可以运用邹氏结构变化的检验。这一问题也可通过引入乘。这一问题也可通过引入乘法形式的虚拟变量来解决。法形式的虚拟变量来解决。将将n1与与n2次观察值合并,并用以估计以下回归:次观察值合并,并用以估计以下回归:Di为引入的虚拟变量:于是有:可分别表示1990年后期与前期的储蓄函数。 在统计检验中,如果在统计检验中,如果 4=0的假设被拒绝,则说的假设被拒绝,则说明两个时期中储蓄函数的斜率不同。明两个时期中储蓄
177、函数的斜率不同。n具体的回归结果为:(-6.11)(22.89)(4.33)(-2.55)由3与4的t检验可知:参数显著地不等于0,强烈示出两个时期的回归是相异的,储蓄函数分别为:储蓄函数分别为:1990年前:1990年后:=0.9836 3、临界指标的虚拟变量的引入在在经经济济发发生生转转折折时时期期,可可通通过过建建立立临临界界指指标标的的虚虚拟拟变变量模型来反映。量模型来反映。例如,进进口口消消费费品品数数量量Y主主要要取取决决于于国国民民收收入入X的的多多少,中国在改革开放前后,少,中国在改革开放前后,Y对对X的回归关系明显不同。的回归关系明显不同。这这时时,可可以以t*=1979年年
178、为为转转折折期期,以以1979年年的的国国民民收收入入Xt*为临界值,设如下虚拟变量:为临界值,设如下虚拟变量:则进口消费品的回归模型可建立如下:则进口消费品的回归模型可建立如下: OLS法得到该模型的回归方程为则两时期进口消费品函数分别为:则两时期进口消费品函数分别为:当tt*=1979年,当tt*=1979年,三、虚拟变量的设置原则虚拟变量的个数须按以下原则确定:如果有m个定性因素,在有截矩项的模型中引入m-1个虚拟变量。在无截矩项的模型中引入m个虚拟变量例。已知冷饮的销售量。已知冷饮的销售量Y除受除受k种定量变量种定量变量Xk的影响的影响外,还受春、夏、秋、冬四季变化的影响,要考察该四外
179、,还受春、夏、秋、冬四季变化的影响,要考察该四季的影响,只需引入三个虚拟变量即可:季的影响,只需引入三个虚拟变量即可:则冷饮销售量的模型为:则冷饮销售量的模型为:n在上述模型中,若再引入第四个虚拟变量在上述模型中,若再引入第四个虚拟变量则冷饮销售模型变量为:其矩阵形式为: 如果只取六个观测值,其中春季与夏季取了两次,秋、冬各取到一次观测值,则式中的:显然,显然,(X,D)中的第中的第1列可表示成后列可表示成后4列的线性组合,从列的线性组合,从而而(X,D)不满秩,参数无法唯一求出。不满秩,参数无法唯一求出。这就是所谓的“虚拟变量陷井”,应避免。应避免。案例分析:书上(P236)模型估计,在Eviews软件输入:ycx(x-66850.5)*d1(x-88254)*d2此例为分段线性回归(此例为分段线性回归(P226)