例题:电力产量函数例题:电力产量函数LS LOG(Y) C PDL(LOG(X), 7,2, 2)3 3. . KoyckKoyck几何滞后几何滞后tiititXYµβα++=∑∞=−0对于无限分布滞后模型:对于无限分布滞后模型:iiλββ0=假设假设其中其中,,0 0< <λ λ< <1 1,,称为分布滞后衰减率称为分布滞后衰减率,,1 1- -λ λ称为调整速率称为调整速率((SpeedSpeed ofof adjustmentadjustment))101)1 (−−−++−=−tttttXYYλµµβαλλ整理得整理得如何估计模型参数如何估计模型参数??长期乘数长期乘数LRP=LRP=??OLSOLS估计是一致的吗估计是一致的吗??001,ttttyxyvαβλ−=+++1tttvµλµ−=−这样一来这样一来,,克服了什么问题克服了什么问题?? 产生了什么问题产生了什么问题??MA(1)赵芳赵芳,,杨晓锋杨晓锋:产业结构:产业结构、、人力资本分布结构与收入差距人力资本分布结构与收入差距,,《《华东经济管理华东经济管理》》,,20152015年第年第1 1期期周开国周开国,,徐亿卉徐亿卉: : 中国上市公司的资本结构是否稳定中国上市公司的资本结构是否稳定,,《《世界世界经济经济》》20122012年第年第5 5期期PDLsPDLs方法应用方法应用可以参阅:可以参阅:理论方法的研究可参考:理论方法的研究可参考:Z. Griliches. Distributed Lags: A Survey. Econometrica, vol. 35, pp.16-49, 1967;M. Nerlove. Lags in Economic Behavior,”Econometrica, vol.40, pp. 221-251, 1972.GDLs应用应用:自适应预期:自适应预期(Adaptive Expectation)模型模型在某些实际问题中在某些实际问题中,,因变量因变量Y Yt t并不取决于解释变量的当前实际值并不取决于解释变量的当前实际值X Xt t,,而取决于而取决于X Xt t的的““预期水平预期水平””或或““长期均衡水平长期均衡水平””X Xt te e。
例如例如,,家庭本期消费水平家庭本期消费水平,,取决于本期收入的预期值或持久收取决于本期收入的预期值或持久收入;市场上某种商品供求量入;市场上某种商品供求量,,决定于本期该商品价格的均衡值决定于本期该商品价格的均衡值自适应预期模型自适应预期模型最初表现形式是最初表现形式是)(11ettetetXXrXX−−−=−自适应预期假定自适应预期假定: :预期系数预期系数0 0≤ ≤r r ≤ ≤1 1“经济行为者将根据过去的经验修改他们的预期”“经济行为者将根据过去的经验修改他们的预期”ettetXrrXX1)1 (−−+=()()()21211ettttXr Xr XrX−−=+−+−+()01itt itiYrrXαβµ∞−==+−+∑etttYXαβµ=++4.有理分布滞后有理分布滞后(RDLs)在在GDLsGDLs模型中模型中,,如果即期影响为正如果即期影响为正,,则滞后影响会则滞后影响会的严格单调下降趋于的严格单调下降趋于0 0RDLsRDLs可以描述更多的现实可以描述更多的现实RDLsRDLs模型是模型是GDLsGDLs模型的推广模型的推广,,可以表示为:可以表示为:00111,tttttyxxyvαββλ−−=++++1tttvµλµ−=−等价于如下的等价于如下的IDLsIDLs模型:模型:()001110011000010011tttttiiiit itit iiiiiitt itiyxxyvxxvxxαββλαλβλβλλαββ λβλµ−−∞∞∞∞−− −−====∞−−==++++=+++=++++∑∑∑∑∑RDLsRDLs可以描述更多的现实可以描述更多的现实。
011,1,0.5ββλ= −==下图中下图中,,0101LRPββλ+==−长期效应为长期效应为例:房产投资与住宅价格膨胀例:房产投资与住宅价格膨胀Hseinv.xlsz=gprice:价价格 通 胀 率 的格 通 胀 率 的对数对数y::log(invpc)即人均房产投即人均房产投资的对数资的对数,, 这这里剔出了线性里剔出了线性趋势趋势R2=0.541988调整的调整的R2=0.503820LRP=0.70668R2=0.406656调整的调整的R2=0.375428LRP=4.688429趋势因素影响趋势因素影响经济学家为他们自己设定的任务过于简单而又无用经济学家为他们自己设定的任务过于简单而又无用,,这就好比在暴风雨这就好比在暴风雨季节季节,,他们唯一能告诉我们的就是他们唯一能告诉我们的就是,,暴风雨过去很长时间之后暴风雨过去很长时间之后,,大海终大海终将再度恢复平静将再度恢复平静————约翰约翰. .梅纳德梅纳德. .凯恩斯,凯恩斯, 19231923年年伪回归伪回归(Spurious Regression)现象现象Granger, C.W.J. and P. Newbold. Spurious regressions in econometrics,Journal of Econometrics, 1974, 26(2):111-120.Phillips, P.C.B. Understanding spurious regressions in econometrics.Journal of Econometrics,1986, 33: 311 – 340.Entorf, H. Random walks with drifts: nonsense regression and spuriousfixed-effect estimation. Journal of Econometrics, 1997, 80: 287 – 296.Lee, Y.-S., Kim, T.-H., Newbold, P. Spurious nonlinear regressions ineconometrics. Economics Letters, 2005, 87: 301 – 306.伪回归伪回归,,也叫也叫虚假回归虚假回归、、谬误回归谬误回归,,是指在本来没有关系的变是指在本来没有关系的变量之间量之间,,直接回归检验的结果却是显著的这种现象直接回归检验的结果却是显著的这种现象。
1. 确定性趋势的影响确定性趋势的影响 2. 随机趋势即非平稳性的影响随机趋势即非平稳性的影响时间趋势时间趋势经济学家把变量随着时间变化而呈现的中长期持续稳定的经济学家把变量随着时间变化而呈现的中长期持续稳定的变化称为趋势变化称为趋势大部分宏观经济变量大部分宏观经济变量都存在时间趋势都存在时间趋势,,而而且有随时间持续上升且有随时间持续上升或稳定下降的趋势或稳定下降的趋势右图显示的是我国城右图显示的是我国城镇消费镇消费、、农村消费农村消费、、GDPGDP、、固定资产形成固定资产形成、、城镇可支配收入城镇可支配收入、、农农村可支配收入村可支配收入确定性趋势估计确定性趋势估计确定性趋势分析是根据序列自身发展变化的基本规律和特点确定性趋势分析是根据序列自身发展变化的基本规律和特点,,选取适当的趋势模型进行分析和预测选取适当的趋势模型进行分析和预测ˆtyabt=+ˆttyab=ˆbtyat=ˆlog( )tyabt=+2ˆtyabtct=++ˆttyLab=+ˆ/tyab t=+ˆbttyae=ˆbttyLae=+ˆtbtyLa=()ˆ/ 1bttyLae=+Compertz模型模型Logistic模型模型35,~ . . ,(0,1)12,~ . . ,(0,1), ttttttttytu uii d normxtv vii d normu vindependent=++= ++伪回归伪回归确定性趋势的影响确定性趋势的影响剔除确定性趋势的影响剔除确定性趋势的影响方法方法1 1,,将趋势因素将趋势因素( (时间时间t)t)加入模型中加入模型中伪回归伪回归方法方法2 2. . 去趋势化后再回归去趋势化后再回归去趋势化后得到的斜率系数与方法去趋势化后得到的斜率系数与方法1 1的结果相同的结果相同。
问题:问题:log(price)log(price)对对log(invpc)log(invpc)的解释程度如何的解释程度如何??非平稳性的影响非平稳性的影响平稳性平稳性平稳过程平稳过程:任何时点上的随机变量的均值和方差都是常数:任何时点上的随机变量的均值和方差都是常数,,两个不同时点上的随机变量之间的协方差仅与其时间间隔有两个不同时点上的随机变量之间的协方差仅与其时间间隔有关关,,而与时点无关而与时点无关协方差平稳过程协方差平稳过程,,弱平稳过程弱平稳过程平稳时间序列:由一个平稳过程生成的时间序列平稳时间序列:由一个平稳过程生成的时间序列弱相依过程:弱相依过程:一个平稳的过程一个平稳的过程,,如果随着间隔时间越来越如果随着间隔时间越来越长长,,任意两个随机变量渐近不相关任意两个随机变量渐近不相关著名的时间序列的中心极限定理著名的时间序列的中心极限定理,,都要求平稳性或者某种都要求平稳性或者某种程度或形式的弱相依性程度或形式的弱相依性平稳性和弱相依性是时间序列回平稳性和弱相依性是时间序列回归分析中的理想条件归分析中的理想条件)211,1,2,,~.0,ttttuxuutuiid Nασ−=+=()2111,1,2,,~.0,,|| 1ttttuyyu tuiid Nρσρ−=+=<随机趋势与非平稳性随机趋势与非平稳性如果趋势变量在每个时期的变化量不再是常量如果趋势变量在每个时期的变化量不再是常量( (时间的确定时间的确定函数函数) ),,而是一个变化的随机量而是一个变化的随机量,,则称为则称为随机趋势变量随机趋势变量。
tttyzu=+( )0ttjjE zEttαεα==+=∑( )()()000varvarvar2cov,ttttjjjkjjjkjztαεεεε===>=+=+∑∑∑∑1tttzzαε−−=+随机趋势变量不是协方差平稳的随机趋势变量不是协方差平稳的非平稳过程非平稳过程::随机游走随机游走、、带漂移的随机游走过程带漂移的随机游走过程1 ,~ttttzziidαε ε−=++包含一般趋势:包含一般趋势:101,~ttttzztiidρββε ε−=+++序列序列y1是由随机游走是由随机游走生成,生成,非平稳非平稳序列序列x1是由自回归过是由自回归过程生成,程生成,非平稳非平稳Y1和和x1是独立生成的是独立生成的在在5%的显著水平下,的显著水平下,x1对对y1影响显著影响显著这也是这也是伪回归现象伪回归现象非平稳性的影响非平稳性的影响(例例1)X X是由一个随机游走过程的实是由一个随机游走过程的实现;现;Y Y是由另一个随机游走过是由另一个随机游走过程的实现;程的实现;X X与与Y Y相互独立相互独立伪回归伪回归非平稳性的影响非平稳性的影响(例例2)DavidsonandMacKinnon(1993) 曾 做 了曾 做 了10000次随机抽样次随机抽样,,发现发现66.2%的机会回归的机会回归的的t检验在检验在5%的水平下是显著的的水平下是显著的。
干扰项不包含随机干扰项不包含随机趋势趋势干扰项包含随机趋干扰项包含随机趋势势解释变量不包含随解释变量不包含随机趋势机趋势大数定律成立大数定律成立中心极限定理成立中心极限定理成立大数定律不成立大数定律不成立中心极限定理不成中心极限定理不成立立解释变量包含随机解释变量包含随机趋势趋势大数定律成立大数定律成立中心极限定理不成中心极限定理不成立立大数定律不成立大数定律不成立中心极限定理不成中心极限定理不成立立大数定律成立时大数定律成立时,,OLSOLS估计是一致的;当中心极限定估计是一致的;当中心极限定理成立时理成立时,,t t统计量和统计量和F F统计量渐近服从统计量渐近服从t t分布和分布和F F分布分布随机趋势对回归的影响随机趋势对回归的影响克服伪回归克服伪回归----格兰杰和纽博特方法格兰杰和纽博特方法如果两个序列包含如果两个序列包含随机趋势随机趋势,,而他们各自的一阶差分而他们各自的一阶差分都是平稳的都是平稳的,,则格兰杰则格兰杰- -纽博特的方法建议采取差分纽博特的方法建议采取差分回归回归,,检验两个变量的关系检验两个变量的关系如果两个序列不包含随机趋势如果两个序列不包含随机趋势,,则应该避免采取差分则应该避免采取差分回归的分析方法回归的分析方法,,因为:因为:(1)(1)差分后的解释变量具有更小的变异性差分后的解释变量具有更小的变异性,,OLSOLS估计的估计的有效性下降;有效性下降;(2)(2)分析不含趋势的差分数据可能导致本来不存在的分析不含趋势的差分数据可能导致本来不存在的序列相关性序列相关性。
从而从而OLSOLS估计的有效性下降估计的有效性下降,,检验变检验变得困难得困难非平稳性的检验非平稳性的检验先看几个时间序列先看几个时间序列自回归过程与单位根的ADF检验滞后阶数的自动选择滞后阶数的自动选择结构突变序列的单位根检验结构突变序列的单位根检验如果直接用如果直接用DFDF或者或者ADFADF检验检验,,其结果会是存在单位根其结果会是存在单位根,,出现错出现错误误虚拟变量的应用虚拟变量的应用例题例题1. 中国进口额数据的单位根检验中国进口额数据的单位根检验2. 深圳成指的单位根检验深圳成指的单位根检验3. 中国就业人员数的单位根检验中国就业人员数的单位根检验协整关系与误差修正模型非平稳经济变量之间长期稳定的均衡关系非平稳经济变量之间长期稳定的均衡关系,,称为协称为协整关系或协积关系整关系或协积关系如果如果x x向量是向量是I(d),I(d), 存在非零列向量存在非零列向量a a,,使得使得a’xa’x是是I(dI(d- -b),b),则则x x的各个分量之间存在的各个分量之间存在(d,b)(d,b)阶协整关系阶协整关系协整向量与协整参数协整向量与协整参数EGEG检验和检验和AEGAEG检验检验两个变量的情形两个变量的情形多个变量的情形多个变量的情形进口进口(im)(im)与出口与出口(ex)(ex)是是CI(CI(3 3, ,2 2) )的的。
但是但是log(ex)log(ex)与与log(im)log(im)是是CI(CI(1 1, ,1 1) )的的,,即是协整的即是协整的误差修正模型误差修正模型误差修正模型误差修正模型((ErrorError CorrectionCorrection ModelModel))最初最初由由Sargan(Sargan(19641964) )提出提出恩格尔和格兰杰将恩格尔和格兰杰将ECMECM与协与协整理论结合整理论结合,,提出建立提出建立ECMECM的一般方法的一般方法( (19871987) ). .ECMECM将长期关系和短期效应结合起来将长期关系和短期效应结合起来根据格兰杰根据格兰杰定理定理,,存在均衡关系的非平稳变量之间必有误差存在均衡关系的非平稳变量之间必有误差修正模型表达式存在修正模型表达式存在例:中国进口与出口的误差修正模型例:中国进口与出口的误差修正模型格兰杰因果检验G r a n g e r(1969)G r a n g e r(1969)因果关系检验法的基本想法:因果关系检验法的基本想法:如果如果X X的变化引起的变化引起Y Y的变化的变化,,则则X X的变化应当发生在的变化应当发生在Y Y的变化之前的变化之前。
特别地特别地,,说说““ X X是引起是引起Y Y变化的原因变化的原因””,,则必须满足两个条件则必须满足两个条件第一第一,,X X应该有助于预测应该有助于预测Y Y,,即在即在Y Y关于关于Y Y的过去值的回归中的过去值的回归中,,添添加加X X的过去值作为独立变量应当显著地增加回归的解释能力的过去值作为独立变量应当显著地增加回归的解释能力第二第二,, Y Y不应当有助于预测不应当有助于预测X X,,其原因是如果其原因是如果X X有助于预测有助于预测Y Y,,Y Y也有助于预测也有助于预测X X,,则很可能存在一个或几个其他的变量则很可能存在一个或几个其他的变量,,它们它们既是引起既是引起X X变化的原因变化的原因,,也是引起也是引起Y Y变化的原因变化的原因利用利用F F检验统计量检验统计量. .石油与经济石油与经济(J.D.Hamiltom,1983)先有鸡还是先有蛋?先有鸡还是先有蛋?Chicken ,eggs, and causality, or which came first?American Journal ofAgrecutural Economics, 1988.受受限因变量模型限因变量模型二元选择模型的形式二元选择模型的形式假设有一个未被观察到的潜在变量假设有一个未被观察到的潜在变量y yi i* *,,它与它与x xi i之间具之间具有线性关系有线性关系,,即即**iiiuy+=βx其中:其中: u ui i* *是扰动项是扰动项。
y yi i和和y yi i* *的关系如下:的关系如下:≤>=0001**iiiyyy)()()0(),|0()(1)()0(),|1(****βxβxβxβxβxβxiiiiiiiiiiiiFuPyPyPFuPyPyP−=−≤=≤==−−=−>=>==()iiiuFy+−−=βx1于是于是,,二元选择模型的一般形式为:二元选择模型的一般形式为:49ui*对应的分布对应的分布分布函数分布函数F 相应的二元选择模型相应的二元选择模型标准正态分布标准正态分布Probit 模型模型逻辑分布逻辑分布Logit 模型模型极值分布极值分布Extreme模型模型)(xΦ)1 (xxee+)exp(1xe−−( )xΦ∏∏==−=01)()](1 [iiyyiiFFLβxβx最大似然估计最大似然估计∏=−−=NiyiyiiiFFL11)](1 [)]([βxβx∑==−−−+=∂∂NiiiiiiiiFfyFfyL10)1 ()1 (lnxβ实例:实例:云美萍,龙科军,劳云腾:考虑考虑停车选停车选择概率的公共停车场规模优化择概率的公共停车场规模优化模型模型《系统工程》, 2008蔡昉,王美艳:中国中国城镇劳动参与率的城镇劳动参与率的变化及其政策变化及其政策含义含义 。
《中国社会科学》,2004两候选人选择的两候选人选择的logit模型结果模型结果两候选人选择的两候选人选择的probit模型结果模型结果52多元选择多元选择模型模型当当因变量不止是两种选择时因变量不止是两种选择时,,就要用到多元选择模型就要用到多元选择模型(multiple(multiplechoicechoice model)model)多元离散选择问题普遍存在于经济生活中多元离散选择问题普遍存在于经济生活中 (1 1) ) 一个人面临多种职业选择一个人面临多种职业选择,,将可供选择的职业排队将可供选择的职业排队,,用用0 0,,1 1,,2 2,,3 3表示表示影响选择的因素有不同职业的收入影响选择的因素有不同职业的收入、、发展前发展前景和个人偏好等景和个人偏好等;;((排序选择排序选择))( (2 2) ) 同一种商品同一种商品,,不同的消费者对其偏好不同不同的消费者对其偏好不同例如例如,,十分十分喜欢喜欢、、一般喜欢一般喜欢、、无所谓无所谓、、一般厌恶和十分厌恶一般厌恶和十分厌恶,,分别用分别用0 0,,1 1,,2 2,,3 3,,4 4表示表示而影响消费者偏好的因素有商品的价格而影响消费者偏好的因素有商品的价格、、性能性能、、收入及对商品的需求程度等收入及对商品的需求程度等;; ((排序选择排序选择))( (3 3) ) 一个人选择上班时所采用的方式一个人选择上班时所采用的方式————自己开车自己开车,,乘出租乘出租车车,,乘公共汽车乘公共汽车,,还是骑自行车还是骑自行车。
不是排序选择不是排序选择))Logit模型很容易推广到多元选择问题模型很容易推广到多元选择问题喻开志,李俊峰,邹红: 中国中国职业类职业类别选择研究别选择研究——基于多类别职业选择基于多类别职业选择模模型型《统计与信息论坛》,2014<≤<≤<≤=*3*22*11*210iMiiiiycMcyccyccyy如果如果如果如果**iiiuy+=βxNi,,2,1=)(1)()()()2()()() 1()()0(23121βxβxβxβxβxβxiMiiiiiiiiicFMyPcFcFyPcFcFyPcFyP−−==−−−==−−−==−==排序选择模型排序选择模型审查回归模型审查回归模型(Censored Regression Model)≤<<≤=****iiiiiiiiiiiycifccycifycyifcyiiiuσy+=βx*其中:其中: ,, 代表截取代表截取((审查审查))点点,,是常数值是常数值如果没有如果没有左截取左截取( (审查审查) )点点,,可以设为可以设为如果没有右截取如果没有右截取( (审审查查) )点点,,可以设为可以设为。
icic−∞=ic∞=ic规范的规范的TobitTobit模型模型是具有是具有和和的的一个特例一个特例0=ic∞=ic周华林,李雪松:TobitTobit模型估计方法与模型估计方法与应用应用. . 经济学经济学动态动态,, 20152015,,((0505))::105105- -119119. .截断回归模型截断回归模型((Truncated Model))在研究与收入有关的问题时在研究与收入有关的问题时,,收入作为被解释变量收入作为被解释变量从理论上讲从理论上讲,,收入应该是从零到正无穷收入应该是从零到正无穷,,但实际中由但实际中由于各种客观条件的限制于各种客观条件的限制,,只能获得处在某个范围内的只能获得处在某个范围内的样本观测值样本观测值这就是一个截断问题这就是一个截断问题截断回归模型的截断回归模型的形式如下:形式如下:iiiuy+=βxNi,,2,1=其中:其中:yi只有在只有在时才能取得样本观测时才能取得样本观测值值,,,为为两个常数两个常数iiiicuc<+<βxicic计数模型计数模型当因变量当因变量 y 表示事件发生的数目表示事件发生的数目,,是离散的整数是离散的整数,,即即为计数变量为计数变量,,并且数值较小并且数值较小,,取零的个数多取零的个数多,,而解释而解释变量多为定性变量时变量多为定性变量时,,应该考虑应用计数模型应该考虑应用计数模型((countmodels))。
例如例如,,一个公司提出申请的专利的数目一个公司提出申请的专利的数目,,以及在一个固定的时间间隔内的失业人员的数目以及在一个固定的时间间隔内的失业人员的数目在在计数模型中应用较广泛的为泊松模型计数模型中应用较广泛的为泊松模型58设设每个观测值每个观测值 yi都来自一个服从参数为都来自一个服从参数为m(xi,β β) 的泊的泊松分布的总体松分布的总体,,对于对于泊松模型泊松模型((poisson model)),,给定给定 xi时时 yi的条的条件密度是泊松分布:件密度是泊松分布:由由泊松分布的特点泊松分布的特点,,参数参数β β 的极大似然估计量的极大似然估计量((MLE))通过最大化如下通过最大化如下的对数似然函数来得到:的对数似然函数来得到:((7.4.4))βxβxβxieyEmiii=≡),(),(!),(),(),(iyimiiymeyfiiβxβxβx−=βxβxβxβxiemyEyiiiii===),(),(),var(∑=−−=NiiiiiymmyL1)]!ln(),(),(ln[)(βxβxβ。