文档详情

经济计量方式导论第二讲

hua****92
实名认证
店铺
DOCX
19.54KB
约5页
文档ID:288128429
经济计量方式导论第二讲_第1页
1/5

经济计量方式导论第二讲第二讲简单截面数据的经济计量方法(一)线性回归分析是简单截面数据经济计量的基本方法主要内容:一元线性回归模型何为线性模型模型参数的含义模型参数的估计和前提假设调查主要内容在自变量和因变量具有统计关系的线性假设下一元线性回归模型(简单线性回归模型)问题:为什么需要统计关系的线性假设?是什么?参数说明了什么?一元线性回归模型uxy10例:y是支出、x是收入变量间统计关系的线性假设下选择线性模型线性的理解:第一:y是x的线性函数第二:y与系数是线性关系线性回归研究以参数线性,而非以x为线性变量之间的非线性关系转化为线性关系样本体现的变量之间的线性关系在总体中是否显著,是需要检验的(t检验和F检验)为什么需统计关系的线性假设uxy10uxy210Y与x之间非线性uxy10Y与1之间非线性变量间统计关系的线性假设下选择线性模型统计关系非函数关系,是一种不确定性关系为误差项(errorterm)或干扰项(disturbance),表示除x之外其他影响y的、“观测不到”的因素导致存在的原因:理论含糊:理论不完备数据的欠缺:影响因素的数据无法获得;或者,从数据收集成本和计算成本角度考虑,列出不值得内在随机性:即使列出所有因素也存在个体随机性简单模型原则:若简单模型足以,就把其他因素看做吧!uxy10其他影响因素均放在u中目的:分析自变量对应变量的边际效应1是斜率参数,含义:简单线性回归模型中的1即为x对y的边际效应1含义的前提:中其他因素保持不变模型参数的含义xyuuxxyuxyjijiii110100)(,则若例:y是工资水平、x是受教育程度问题一:如果u中包括了个人能力?包括了职位?处理方法:假定u与x不相关;多元线性回归模型如何测度和x的相关性方法一:简单相关系数,仅反映线性相关方法二:对给定x时,对做均值独立假定因为:只要方程中含有0,一定有:所以:的零条件均值假设:0)(E)()|(ExE0)()|(ExE例:将个人能力做标准化处理,在总体中均值为零的零条件均值假设是简单线性回归模型的重要前提iiiuxy10例:不同受教育程度的人气个人能力的平均值是相同的因为:的零条件均值假设所以:意义:E(y|x)是x的线性函数,使1的含义更直观:x变化一个单位使y平均变动1xxyE10)|(uxy10一元线性总体回归函数对于给定的x值,y的分布都以E(y|x)为中心问:y的方差?问题二:变量计量单位改变会影响1吗?(2.6.1节)因变量和自变量均扩大或缩小形同的倍数:仅因变量扩大或缩小某倍数:仅自变量扩大或缩小某倍数:iiiiiiiiiiiiicuxccyuxcyuxyxxcyy*10*10*10*),(,iiiiiiiiiiiicuxcyucxcyuxycxxcyyi*10**10*10*),(,斜率不变斜率扩大或缩小相同的倍数iiiiiiiiiiiiiuxcyucxyuxycxxyy*10**10*10*,,斜率缩小或扩大相同的倍数问题三:不论xi的初始值如何,它的变化对y的影响是相同,对经济研究是不现实的应用中可能关心百分数的变化例:受教育年份增加带来的工资绝对量的增长通常是非线性的,但百分比增长可能不变建立y对x的非线性模型对数模型倒数模型多项式模型(在多元中讲)关注:绝对量间、绝对量与相对量间、相对量与绝对量间、相对量间的变化关系对数模型:对变量是非线性,对参数是线性半对数模型线性到对数模型、对数到线性模型常见的非线性模型对数到线性模型斜率参数的含义(2.6.2节)对数之差近似等于变化比例x变化一个单位引起y的变化百分比平均变动1001,1001称为y对x的半弹性(elastcity)对数的变化是个相对变化,1是对x的绝对变化引起y的相对变化的测度半对数模型斜率参数的含义xyyyxxyxyijiijiii11010logloglog)(loglogxYyYyyyyyyyyiiiij)100(%log100:/:,/)(log1,则记线性到对数模型斜率参数的含义x的变化百分比变动一个单位引起y值的平均变动1/100半对数模型斜率参数的含义Xyxyxxyxyiijiii111010),log()log()log(logXy%1001双对数模型(对数-对数模型)较常见例:道格拉斯生产函数双对数模型斜率参数的含义x的变化百分比变动一个单位引起y的变化百分比平均变动11称为y对x的弹性,双对数模型也称常弹性模型双对数模型斜率参数的含义XYxyxxyxyiijiii111010),log()log()log()log()log(log)log(XY%1uHKyloglogloglog321ueHKy321双对数模型的特点(6.2节):斜率系数不随计量单位的变化而变化,只体现在常数项上当y大于0时,log(y)比y更接近模型对因变量分布的假定(正态分布)双对数模型斜率参数的含义iiiiiiiiiiiiicuxccyucxcyuxyxcxycy*12110*2*101*102*1*log)loglog(log),log(logloglog,模型参数估计的出发点:模型的参数估计X和y的协方差与x的方差之比因为:所以:对数据的要求:x的方差不等于0当得到参数估计值后,有:样本回归函数,是对总体回归函数的估计根据样本回归函数计算拟合值和残差:问:残差项等同于误差项?答:不等同,具体见后分母不能为零普通最小二乘法(OrdinaryLeastSquares,OLS:)在残差平方和最小下的参数前述中参数估计的前提:误差零条件均值假设问:OLS似乎和假设无关,但为什么一般教科书首先谈假设?答:假设是OLS估计量良好性质的保证(一致性、无偏性、有效性)OLS的一阶条件高斯-马尔科夫假定1:线性于参数高斯-马尔科夫假定2:随机抽样具有一个服从线性回归模型的随机样本随机样本的获得方式:固定X值,重复随机抽样,且样本量应大于自变量的个数例:研究施肥量和品种对亩产量的影响通常可保证自变量方差不为0在重复抽样中固定X意味着ui与Xi是独立的,但实际问题并非如此对观测数据的获得往往不是固定X的随机抽样例:研究家庭收入和支出关系时,随机抽样并同时记录下收入和支出,ui与Xi的独立是不确定的高斯-马尔科夫假定3:零条件均值高斯-马尔科夫假定格兰杰说:“如果在n趋于无穷时还不能正确地得到它,就不应该干这件事”OLS统计量的一致性当样本量增大时,能够让估计量接近真值!假定1-假定3保证了OLS估计量的一致性因为:分子:假定1-假定3保证了OLS估计量的一致性证明:应用大数定律,分子分母分别收敛于总体的:渐进偏误(5.1节)若x和u不相关,为0,无渐进偏误若x和u正相关,为正偏误;反之为负偏误渐进偏误,记为假定1-假定3保证了OLS估计量的无偏性证明:(续):对y均值的预测:)()()(1010yExxEyE虽然OLS是无偏的,但进一步还要了解它距真值的平均差距,即OLS统计量的方差高斯-马尔科夫假定4:同方差性OLS统计量的无偏性误差方差给定x条件下x为非随机的异方差常数方差假定4使OLS估计量的方差可以度量因为:所以:自变量差异越大,OLS的方差越小,且取决于误差项的方差OLS统计量的无偏性估计误差项的方差2虽然:,但因无法观测u,无法计算若以残差替代误差,有:但因为残差还需要满足两个一阶条件,所以残差只有n-2个自由度:于是得到OLS统计量的方差回归标准误差(Standarderroroftheregression,SER)OLS统计量的无偏性)()()()var(2222uEuEuEu高斯-马尔科夫定理(3.5节)在假定1至假定4下,各估计量分别是其真值的最优线性无偏估计(bestlinearunbiasedestimator,BLUE)线性是指估计量是因变量和自变量的线性函数意味:不需要再寻找其他无偏估计量,没有一个会比OLS更好总之:假定1-假定3:确保了估计量的无偏性假定4:确保了估计量方差的可度量性和有效性,即:高斯-马尔科夫定理)()(VarVar总体斜率参数的假设检验问:为什么要对总体斜率参数进行假设检验答:模型是建立在y与x的线性假设下的,需检验y与x的线性关系在总体上是否显著,进而判断选择线性模型的合理性已知OLS统计量的期望和方差,如果知道其分布,便可对总体斜率参数进行假设检验需增加假定如何评价模型假定5(4.1节):给定x条件下,误差u服从均值为0方差为2的正态分布意味:给定x条件下,y服从均值为E(y)方差为2的正态分布假定1至假定5称为经典线性模型假定(classicallinearmodelassumption),该假定下的模型称为经典线性模型(CLM)说明:经典线性模型包括多元线性回归模型,其假设包含与多元有关的假设(后面讲)总体估计斜率参数的假设检验经典线性模型假设下,给定x条件下,斜率参数的抽样分布为:一元线性回归模型中,OLS统计量的方差Var(1):多元线性回归模型后面讲于是,有:因为:一元模型中的误差项的方差替代为:所以:说明:若假定5不满足,大样本下OLS估计量具有渐进性质,渐进服从上述分布构造t统计量进行假设检验,零假设为斜率参数与0无显著差异Sd和se的区别:前者为,后者为的估计值拟合优度:x如何好地解释了y涉及到残差的问题如何评价模型如果大部分的点落在回归线上,则拟合效果好,x较好地解释了y残差不等同于误差:残差的性质:根据0LS一阶条件:有:有:拟合值与残差的样本协方差为0两者之差的期望为零,但并不等同)()()(iiiiyEuyEyE0)()()()()()(),(1010iiiiiiiiiiiuxEuEuxEuEyEuyEuyCov残差性质下有:总平方和=解释平方和+残差平方和如何评价模型0),()1()(11)(11)(11111iiniiiiniiiiniiiyuCovnyEyunnyEyunnyyunn决定系数(coefficientofdetermination):决定系数表明:y的变差中被x解释的部分,不大于1,越接近于1,拟合优度越高如何评价模型问:在社会经济问题研究中高斯-马尔科夫假定哪些不易满足?无法满足带来的问题是什么?无法满足时应如何处理?答:假定:不易满足;导致估计量是有偏估计;处理方法:控制其他因素,建立多元回归模型假定:不易满足(异方差),i的分布与x的取值有关(例:收入与消费关系);不影响参数估计的无偏性,但无法计算OLS统计量的抽样方差,参数显著性检验失效;处理方法:加权最小二乘0)()|(ExE5Word版本。

下载提示
相似文档
正为您匹配相似的精品文档