东北财经的大学2016级博士研究生计量经济学复习备考资料

资源描述

《东北财经的大学2016级博士研究生计量经济学复习备考资料》由会员分享，可在线阅读，更多相关《东北财经的大学2016级博士研究生计量经济学复习备考资料（16页珍藏版）》请在金锄头文库上搜索。

1、 1 计量经济学复习资料一、虚拟变量：（20 分）（给出实际经济问题，根据目标设计虚拟变量，写出模型。考察一种群体异质。完整考察如何设计，如何运用到模型中。）注意事项：（1）注意虚拟变量陷阱是指一般在引入虚拟变量时要求如果有 m 个定性变量，在模型中引入 m-1 个虚拟变量。否则，如果引入 m 个虚拟变量，就会导致模型解释变量间出现完全共线性的情况。我们一般称由于引入虚拟变量个数与定性因素个数相同出现的模型无法估计的问题，称为虚拟变量陷阱。（2）虚拟变量的应用分为两种情况：虚拟变量做解释变量和虚拟变量做被解释变量（定性相应模型）。（3）要掌握虚拟变量引入模型的三种方法，即

2、加法模型、乘法模型和既加又乘模型。 1、举例说明如何引进加法模式、乘法模式和既加且乘模型建立虚拟变量模型。答案：设 Y 为个人消费支出；X 表示可支配收入，定义（1）如果设定模型为虚拟变量单独做解释变量，此时模型仅影响截距项，差异表现为截距项的和，因此也称为加法模型。（2）如果设定模型为 tttttttuXDBXDBXDBBYt4433221 虚拟变量与一个数值变量相乘后做解释变量，此时模型仅影响斜率，差异表现为截距项的和，因此也称为乘法模型。（3）如果设定模型为此时模型不仅影响截距项，而且还影响斜率项。差异表现为截距和斜率的双重变化，因此也称为既加且乘模型。例题 1 考虑下

3、面的模型：其中，Y 表示大学教师的年薪收入， X 表示工龄。为了研究大学教师的年薪是否受到性别、学历的影响。按照下面的方式引入虚拟变量：（10 分） 2 1. 基准类是什么？ 2. 解释各系数所代表的含义，并预期各系数的符号。 3. 若 B4B3，你得出什么结论？答案：（1）基准类是本科学历的女教师。（2）B0 表示刚参加工作的本科学历女教师的收入，所以 B0 的符号为正。 B1 表示在其他条件不变时，工龄变化一个单位所引起的收入的变化，所以 B1 的符号为正。B2 表示男教师与女教师的工资差异，所以 B2 的符号为正。 B3 表示硕士学历与本科学历对工资收入的影响，所以 B3 的符

4、号为正。 B4 表示博士学历与本科学历对工资收入的影响，所以 B4 的符号为正。（3）若 B4B3，说明博士学历的大学教师比硕士学历的大学教师收入要高。例题 2 性别因素可能对年薪和工龄之间的关系产生影响。试问这种影响可能有几种形式，并设定出相应的计量经济模型。性别因素可能对年薪和工龄之间的关系的影响有三种方式。第一种，性别只影响职工的初始年薪，设定模型为：例题 3 考虑下面的模型：其中，YMBA 毕业生收入，X工龄。所有毕业生均来自清华大学，东北财经大学，沈阳工业大学。 3 （1）基准类是什么？基准类是东北财经大学 MBA 毕业生。你预期各系数的符号如何？预期 B1 的符

5、号为正；B2 的符号为正；B3 的符号为负。（1）如何解释截距 B2 、B3？截距 B2 反应了清华大学 MBA 毕业生相对于东北财经大学MBA 毕业生收入的差别；截距B3反应了沈阳工业大学MBA 毕业生相对于东北财经大学MBA毕业生收入的差别。）（2）若 B2B3，你得出什么结论？（3）如果 B2B3，我们可以判断清华大学 MBA 毕业生的收入平均高于沈阳工业大学 MBA毕业生的收入。二、异方差和自相关问题（25 分）（一）异方差问题模型，如果出现，对于不同的样本点，随机扰动项的方差不再是常数，而且互不相同，则认为出现了异方差。在现实经济中，异方差性经常出现，

6、尤其是采用截面数据作样本的计量经济学问题。例如：工业企业的研究与发展费用支出同企业的销售和利润之间关系的函数模型；服装需求量与季节、收入之间关系的函数模型；个人储蓄与个人可支配收入之间关系的函数模型等。检验异方差的主要思路就是检验随机扰动项的方差与解释变量观察值的某种函数形式之间是否存在相关性。 1. 异方差的三大后果：一是最小二乘估计不再是有效估计量，最小二乘法做出的估计量是无偏、线性但不是有效估计量；二是相关参数的 t 检验、模型 F 检验失效；三是估计量的方差是有偏的，参数或因变量预测的置信区间的估计精度下降（甚至这种区间估计是失效的）。 2、异方差的检验识别：异方差

7、的产生机制：截面数据的异方差是由解释变量决定的，因此要找到解释变量与残差方差之间的函数关系，即)(2iixg White 检验的具体步骤如下。以二元回归模型为例， yt = 0 +1 xt1 +2 xt2 + ut (1) 4 首先对上式进行 OLS 估计参数，求残差tu 。做如下辅助回归式，（包括截距项、一次项、平方项、交叉项） 2tu= 0 +1 xt1 +2 xt2 + 3 xt12 +4 xt22 + 5 xt1 xt2 + vt (2) 即用2tu对原回归式（1）中的各解释变量、解释变量的平方项、交叉积项进行 OLS 回归。求辅助回归式（2）的拟合系数 R2。 White 检验

8、的零假设和备择假设是 H0: （1）式中的 ut不存在异方差， H1: （1）式中的 ut存在异方差在不存在异方差假设条件下构造 LM 统计量 LM=n R 2 2(5) 其中 n 表示样本容量，R2是辅助回归式(2)的 OLS 估计式的拟合系数。nR 2属于 LM统计量。判别规则是若 n R 2 2 (5), 接受 H0 （ut 具有同方差）若 nR 2 2 (5), 拒绝 H0 （ut 具有异方差）说明：（1）white 检验本质上是一个大样本检验，如果实证样本较少（100-300），由于 nR 2渐进服从2分布， white 检验的可信度不佳，计量经济学暂时没有好办法；（2

9、）在多元回归中，为了节省自由度，white 检验可以省略交叉项，当 x4、n 在（100-300）之间时省略交叉项。 3、异方差的消除（WLS：加权最小二乘估计）由于异方差使 OLS 被破坏，不是有效估计量，因此使用 WLS。加权最小二乘法是通过模型变换控制异方差。 WLS 的思想：假设回归方程iiiXY10 var(i)=i2已知记iiw1 同乘以方程两边，iiiiiiiwXwwYw10 记作*10*iiiiXwY 而iiiiiw* var(*i)1)var(1)var()var(2*iiiii 异方差消除因此对上式进行 OLS 估计10和是 BLUE。 5 如果i2未知（通常情况

10、下，i2都是未知的，此时用i进行估计，用|1i进行加权）记|1|11n对角阵 XY 注：（1）由于2i仅仅是 cov（i）的估计，因此用|1i进行加权，可能加权后依然存在异方差，此时继续做二次加权；（2）对于界面数据频发的异方差，且 var(i)=i2已知时同方差：ols 等价于 WLS 异方差：WLS 好于 OLS 故可以直接用 WLS（但是不推荐）最好先用 OLS 估计，计算如果存在异方差，再用 WLS 6 （二）自相关问题残差相关问题 1. 定义：经典回归假设中i是一个白噪声，即残差时零均值、同方差和无序列相关的。如果 cov（ji,）0，即残差相关。 2. 产生原因线性

11、回归模型中随机误差项存在序列相关的原因很多，但主要是经济变量自身特点、数据特点、变量选择及模型函数形式选择引起的。（1）经济变量惯性的作用引起随机误差项自相关（2）经济行为的滞后性引起随机误差项自相关（3）一些随机因素的干扰或影响引起随机误差项自相关（4）模型设定误差引起随机误差项自相关（5）观测数据处理引起随机误差项序列相关 3. 产生的影响（与异方差相似）（1）最小二乘估计不再是有效估计量，最小二乘法做出的估计量是无偏、线性但不是有效估计量；（2）相关参数的方差失真，导致相关参数的 t 检验失效； 4. 残差相关的生成机制（时序数据）时序数据的自相关（原因）的影响（结

12、果）受到上一期1 - tt 建立 P 阶自回归模型tpp332211ettttt 时序数据有顺序，用时序刻画因果 5. 自相关的识别（1）DW 检验德斌沃森检验构造一个 DW 统计量：）（1r-12)(221ttttt 样本的相关系数 DW 值在 0-4 之间刻画自相关的程度 7 德斌沃森用穷举法计算了不同的 N 与解释变量 X 下 DW 统计量的两个临界值（DL和Du）细节见附录表格 DW 检验法的缺陷：（1）DW 只刻画了1 - t和t之间的关系，仅适用于一阶自相关，忽视了2- t和t这种跳跃式的结构；（2）DW 对模型形式本身有要求，要求原始方程必须含有截距项，模型中不能含有之后

13、被解释变量 Yt-1（因变量之后刻画刚性，例如投资；工具变量经常引入因变量的滞后变量；政策分期效应） DW 的优点：在小样本情况下，DW 检验比较可靠。（2）LM 检验拉格朗日乘数检验（针对 DW 的缺点提出）重点思想：用 OLS 估计原模型的参数，得到t 用t做一个辅助回归假定阶自相关存在Pt，1p2211pttt 代入原模型中得到tptttteXY)(1p221110 假设0:p210H TR2服从)2(的分布其中 T 代表样本容量 R2 是辅助回归的拟合优度进行显著性检验问题：P 的确定，制定的阶数 P 只需要比真实的阶数高就可以了小样本（500 以内）P=4 大样本

14、（大于 500）P=6 关于 LM 检验有点：适用于各种自相关（高阶），对模型无限制；LM 本质上是一个大样本检验，n绩效的时候，LM 检验的势偏高。此时用 DW。 6. 自相关的修正 GLS 广义最小二乘法思想：原回归模型：tttXY10假设存在一阶自相关ttte11 （1） tttXY10 （2）11101tttXY （1）-（2）得 111101)()1 (tttttttXXXYY 变换为ttteXY*1*0*满足经典假设用 OLS 估计1*00 1 注：1. 自相关阶数 P 的确定（推荐试错法）用试错法，先做一个一阶差分，判断拟差分后的方程是否存在自相关，若存在自相关， 8

15、做二姐拟差分，再验证是否存在自相关 2. 系相关系数的确定（迭代的思想）（1）用 OLS 估计原模型参数，进而得到)1(t；（2）做一个 P 阶自回归，tppttte22211)1(= （3）用 OLS 做估计得到)1( （4）用做 GLS，估计 GLS 后的方程，得到代入原方程，计算)2(t （5）重复（2）（4），直到前后两次得到高度接近，005. 0|)1()(kk 三、定性相应模型（LPM 模型 Logit 模型 Probit 模型）定性响应模型是虚拟变量做被解释变量的情形。（这一块理论性挺强，觉得掌握基本原理、概率的含义、如何将概率方程还原为 y 关于 x 的方程就行）这类

16、模型处理的问题是因变量是离散数据，即二元选择数据（因变量不是取1就是取0）。例如家庭买房的决策，是否买房。 1线性概率模型（LPM）模型的形式如下， yi = + xi + ui (1) 其中 ui为随机误差项，xi为定量解释变量。yi为二元选择变量。 1 （若是第一种选择） yi = 0 （若是第二种选择）对 yi取期望， E(yi) = + xi (2) 下面研究 yi的分布。因为 yi只能取两个值，0 和 1，所以 yi 服从两点分布。把 yi的分布记为： P ( yi = 1) = pi P ( yi = 0) = 1 - pi 则 E(yi) = 1 (pi) + 0 (1

17、 - pi) = pi (3) 由（2）和（3）式有 pi = + xi （yi的样本值是 0 或 1，而预测值是概率。） (4) 则回归系数的含义为 x 增加一个单位，采用第一种选择的概率增加。假设用这个模型进行预测，当预测值落在 0，1 区间之内时，则没有什么问题；但当 9 预测值落在0， 1 区间之外时，则会暴露出该模型的严重缺点。因为概率的取值范围是 0，1，所以此时必须强令预测值（概率值）相应等于 0 或 1。线性概率模型常写成如下形式。 1, + xi 1 pi = + xi , 0 + xi R2原，则共线性严重到要处理。 5、修正方法：（）共线性的修正方法有很多，按照

18、优劣程度排序，主要有五种方法：方法 1：扩充样本以减弱共线性。主要通过增加自由度来提高精度，如将时序数据或截面数据变为面板数据，从而将一维数据变为二维。评价：这种方法最理想，但存在的缺点是：效果不定；不可行（一般情况下，研究者在研究时已经找到能够着的样本，扩大样本通常不是可行办法。）。方法 2：工具变量法（IV+2SLS）。主要通过工具变量，运用两阶段最小二乘完成。评价：这种方法目前最受欢迎，高质量的期刊论文通常都采用该方法。缺点是：由于相关关系具有传导性，工具变量 S 很难找；用 S 替代 X，有时经济正当性不足。方法 3：变量变换法。可以通过对数变换、绝对转相对和方程变换（差分）

19、进行变量变换。 1 5 评价：这种方法最简单易行，但存在的缺点是：简单相关系数描述的是线性关系，而对数是非线性化过程；功效不足；不是所有变量都能用来做变换，必须有明确的经济学指代。方法 4：逐步回归法。主要是通过降维减少变量来减弱共线性。评价：这种方法要慎用，最大的缺点是：虽然能很好地解决共线性问题，但是却引发了更严重的内生性问题。方法 5：主成份分析法或因子分析法。具有降维的作用，主要用于多指标评价。评价：该方法很好地消除了共线性。但这种方法要慎用，最大的缺点是：经济含义伤害过大。（三）回归模型中，如果遗漏了重要解释变量，其后果是什么？模型设定偏误的后果有：（1）如果遗漏了重要的

20、解释变量，会造成 OLS 估计量在小样本下有偏，在大样本下非一致；对随机干扰项的方差估计也是有偏的。（2）如果包含了无关的解释变量，尽管 OLS 估计量具有无偏性与一致性，但不具有最小方差性。（3）如果选择了错误的函数形式，则后果是全方位的，不但会造成估计的参数具有完全不同的经济意义，而且估计结果也不同。补充：内生性问题 1. 内生性是指：模型中的解释变量与扰动项相关。通常我们做古典假设i为白噪声，E()=0，var（i）=2，cov(ij)=0；X 是非随机变量（微观可以通过固定抽样得到解决，宏观则不可），则 cov（X,）=0 成立。但是当 cov（X, ）0 时上述假设便不再成立

21、，我们称之为内生性，进而导致 OLS 失效，是非一致性的。 2. 内生性产生的原因：（1）X 与 Y 存在双向因果，即 X 影响 Y 的同时，Y 也影响 X；如金融发展与经济增长；外商直接投资 FDI 与经济增长；犯罪率与警备投入。（2）模型遗漏重要解释变量。无论是缺失重要解释变量导致，还是无法获取数据导致，被遗漏的重要变量进入了残差项，如果与其他解释变量相关，就会出现 cov(Ut,Xt)0，也就是内生性问题。（3）度量误差：由于关键变量的度量上存在误差，使其与真实值之间存在偏差，这种偏差可能会成为回归误差的一部分，从而导致内生性问题。 3. 解决方法：针对双向因果产生的内生性问题，

22、比较容易解决，通过联立方程组即可。难处理的是遗漏重要解释变量的情况，通常采用的方法有：工具变量法（IV）：就是找到一个变量和内生化变量相关，但是和残差项不相关。通常采用 2SLS 方法进行回归。这种方法是找到影响内生变量的外生变量，连同其他已有的外生变量一起回归，得到内生变量的估计值，以此作为 IV，放到原来的回归方程中进行回归。 1 6 （假如我们考察一个工资决定模型012isalaryeducabliu 首先，用 Probit 模型估计()(,)p workf educ abli，得到ip 其次，构建模型012iisalaryeducablipv进行估计）得分匹配与 DID 模型（双

23、差分模型）：思想是按照一定的标准，找到与样本 match的控制组。在假设外在冲击同时影响两个组别的情况下，做差来剔除掉外界冲击的影响。第一步，该方法关键在于得分匹配的确定，配对样本的选择原则是保证两个样本随时间自然变化的部分是相同的，一般根据距离最近作为配对的样本点的方法进行匹配得分。第二步是估计方法，采用双重差分法（DID）。在假设外在冲击同时影响两个组别的情况下，做差来剔除掉外界冲击的影响。（在样本选择上，控制不可观测变量，然后利用双差分模型进行估计 Eg：012isalaryeducabliu （1）样本抽取时，将 ablity 相等或相近的观测值进行配对（匹配标准 IQ/双胞胎）（2）用双差分模型（DID）进行参数估计 01ln(-ln(-+isalarysalaryeduceduc对照组对照组得分组得分组）v 估计出1，等价于原模型中的1 不足：样本要求非常大，尤其是用多重标准进行匹配时，样本要求更大。）潘老师举得例子替代变量例如利用教育水平解释工资收入的模型，该回归模型遗漏了“能力”变量，因为观测不到，将其放入了残差中。可以寻找可观测的替代变量替代能力变量。 Archer 使用了 IQ、EQ、父母收入、儿时居住地的平均房价来替代“能力” 替代变量的本质：对“能力”做一个粗略的测度，替代导致了误差，也会导致内生性。其无法完全消除内生性。

展开阅读全文

东北财经的大学2016级博士研究生计量经济学复习备考资料

最新文档