计量经济学前沿第七讲限制因变量模型与估计

上传人:m**** 文档编号:591643288 上传时间:2024-09-18 格式:PPT 页数:47 大小:7.37MB
返回 下载 相关 举报
计量经济学前沿第七讲限制因变量模型与估计_第1页
第1页 / 共47页
计量经济学前沿第七讲限制因变量模型与估计_第2页
第2页 / 共47页
计量经济学前沿第七讲限制因变量模型与估计_第3页
第3页 / 共47页
计量经济学前沿第七讲限制因变量模型与估计_第4页
第4页 / 共47页
计量经济学前沿第七讲限制因变量模型与估计_第5页
第5页 / 共47页
点击查看更多>>
资源描述

《计量经济学前沿第七讲限制因变量模型与估计》由会员分享,可在线阅读,更多相关《计量经济学前沿第七讲限制因变量模型与估计(47页珍藏版)》请在金锄头文库上搜索。

1、Copyright 2003 Prentice-Hall, Inc.限值因变量限值因变量模型与模型与分析分析第七讲第七讲1Copyright 2003 Prentice-Hall, Inc.主要内容主要内容虚拟变量数据的分析虚拟变量数据的分析 横截面数据的分析横截面数据的分析 平行数据的分析平行数据的分析2Copyright 2003 Prentice-Hall, Inc.限值因变量限值因变量限值因变量限值因变量LDV ( Limited dependent variable) 广义定义:广义定义: 一个取值范围受到限制的因变量称为一个取值范围受到限制的因变量称为LDV。 许多问题涉及二元或多

2、重选择问题:许多问题涉及二元或多重选择问题: 如奖学金对某个人是否上大学的决策的影响? 是什么因素决定一个家庭或个人是否购买保险、买车? 用什么交通工具出行?(公共汽车、地铁、出租车) 选择到哪家超市去购物(有5个可选的地点) 在描述个人、家庭和企业行为模型中的各种限制在描述个人、家庭和企业行为模型中的各种限制 养老金参与率在0100之间 经济参与变量, 对就业者有小时工资W 0,对失业者 W = 0 住房价格,对已购房者p 0,对未购房者p = 03Copyright 2003 Prentice-Hall, Inc. 离散选择模型起源于离散选择模型起源于离散选择模型起源于离散选择模型起源于F

3、echnerFechner于于于于18601860年进行的动物年进行的动物年进行的动物年进行的动物条件二元反射研究,条件二元反射研究,条件二元反射研究,条件二元反射研究,19621962年,年,年,年,WarnerWarner首次将它应用于首次将它应用于首次将它应用于首次将它应用于经济研究领域,用以研究公共交通工具和私人交通工经济研究领域,用以研究公共交通工具和私人交通工经济研究领域,用以研究公共交通工具和私人交通工经济研究领域,用以研究公共交通工具和私人交通工具的选择问题。具的选择问题。具的选择问题。具的选择问题。7070、8080年代,离散选择模型被普遍应年代,离散选择模型被普遍应年代,离

4、散选择模型被普遍应年代,离散选择模型被普遍应用于经济布局、企业定点、交通问题、就业问题、购用于经济布局、企业定点、交通问题、就业问题、购用于经济布局、企业定点、交通问题、就业问题、购用于经济布局、企业定点、交通问题、就业问题、购买决策等经济决策领域的研究。从买决策等经济决策领域的研究。从买决策等经济决策领域的研究。从买决策等经济决策领域的研究。从19871987年出版的专著年出版的专著年出版的专著年出版的专著Econometric Analysis of Discrete ChoiceEconometric Analysis of Discrete Choice(Brsch-Brsch-Sup

5、an, SpringerSupan, Springer)所引用的文献可以看出,模型的估)所引用的文献可以看出,模型的估)所引用的文献可以看出,模型的估)所引用的文献可以看出,模型的估计方法主要发展于计方法主要发展于计方法主要发展于计方法主要发展于8080年代初期。年代初期。年代初期。年代初期。4Copyright 2003 Prentice-Hall, Inc.限值因变量分类离散因变量:离散因变量: 1 1 二元选择二元选择 Y = ( (取值为取值为0 0或或1) 0 0 无序选择无序选择 (各选择间无优劣顺序之分)各选择间无优劣顺序之分) 多重选择多重选择 Y= 1,2,3,4,5 有序选

6、择(有优劣顺序之分,数字之差无意义)有序选择(有优劣顺序之分,数字之差无意义)连续受限制的因变量:连续受限制的因变量: 1)如对房产的真实需求量大于房产的销售量但不可观测,当用销售量代 替需求量时,未买房家庭的真实需求量部分数据被删节。 2)研究妇女的工资收入,我们能收集到有工作的妇女的实际收入数据, 但不能收集到没有工作的妇女的“保留工资”(愿意工作的最低工资线) 3)研究购买汽车的行为,对有车的人,可以记录他们在买车上的花费,而对 那些没有车的人,我们无法测量被调查人愿意为买车花费的最高的费用 5Copyright 2003 Prentice-Hall, Inc.二值因变量模型* * *

7、* 问题问题1 1:除种族不同外,两个条件完全相同的人走进一家银行申请一除种族不同外,两个条件完全相同的人走进一家银行申请一笔抵押贷款,目的是购买一套房子,两套房子的条件也完全相同,他笔抵押贷款,目的是购买一套房子,两套房子的条件也完全相同,他们是否有同等可能性让他们的抵押贷款申请被接受?们是否有同等可能性让他们的抵押贷款申请被接受? 如何精确地检查种族歧视的统计证据如何精确地检查种族歧视的统计证据? 解决办法解决办法1 1 :用抵押贷款申请被拒绝的比重来比较不同种:用抵押贷款申请被拒绝的比重来比较不同种 族的人是否受到同等的待遇族的人是否受到同等的待遇. .* * 问题问题2 2:办法:办法

8、1 1能回答问题能回答问题1 1 所提出的问题吗?所提出的问题吗? 解决办法解决办法2 2:用抵押贷款申请是否被拒绝作为因变量建立多元回归模:用抵押贷款申请是否被拒绝作为因变量建立多元回归模 型,探讨保持其他条件不变(相同)的条件下,种族的型,探讨保持其他条件不变(相同)的条件下,种族的 差异对贷款申请是否被拒绝的影响。差异对贷款申请是否被拒绝的影响。* * 问题问题3: 3: 办法办法2 2 能回答问题能回答问题1 1 所提出的问题吗?所提出的问题吗?6Copyright 2003 Prentice-Hall, Inc.二值因变量模型: 线性概率模型 LPM( Linear probabil

9、ity model ) 线性概率模型是下列多元回归模型:线性概率模型是下列多元回归模型: 其中,因变量其中,因变量Y Yi i 是二元变量,是二元变量, Y Yi i= =1 1 或或 Y Yi i =0=0 u ui i 满足满足 总体回归函数总体回归函数 所以,所以, 7Copyright 2003 Prentice-Hall, Inc.线性概率模型估计系数的含义及检验线性概率模型估计系数的含义及检验 回归系数回归系数回归系数回归系数 就是在保持其他解释变量不变的情况下,就是在保持其他解释变量不变的情况下,就是在保持其他解释变量不变的情况下,就是在保持其他解释变量不变的情况下, 与与与与

10、的单位变化相联系的的单位变化相联系的的单位变化相联系的的单位变化相联系的Y Y=1=1时估计概率(成功的概率时估计概率(成功的概率时估计概率(成功的概率时估计概率(成功的概率 或响应概率)的变化:或响应概率)的变化:或响应概率)的变化:或响应概率)的变化: 回归系数可以用回归系数可以用回归系数可以用回归系数可以用OLS OLS 方法进行估计,并且通常的(异方差方法进行估计,并且通常的(异方差方法进行估计,并且通常的(异方差方法进行估计,并且通常的(异方差 稳健的)稳健的)稳健的)稳健的)OLSOLS标准误可以用来假设检验和构造置信区间标准误可以用来假设检验和构造置信区间标准误可以用来假设检验和

11、构造置信区间标准误可以用来假设检验和构造置信区间 预测的预测的预测的预测的 Y Y 就是预测的成功就是预测的成功就是预测的成功就是预测的成功 ( (Y=1Y=1) ) 的概率。的概率。的概率。的概率。8Copyright 2003 Prentice-Hall, Inc.LMP 模型的估计模型的估计住房所有权与收入关系研究住房所有权与收入关系研究住房所有权与收入关系研究住房所有权与收入关系研究因变量:因变量:因变量:因变量: Y Y=1=1,若拥有住房者;否则若拥有住房者;否则若拥有住房者;否则若拥有住房者;否则, , Y Y=0=0解释变量:收入解释变量:收入解释变量:收入解释变量:收入 x

12、x ( (千美元)千美元)千美元)千美元)用用用用LMPLMP模型的模型的模型的模型的OLSOLS和和和和WLSWLS估计结果估计结果估计结果估计结果OLSOLS估计估计估计估计 p542p542 结果结果结果结果9Copyright 2003 Prentice-Hall, Inc.10Copyright 2003 Prentice-Hall, Inc.线性概率模型的局限性及解决办法线性概率模型的局限性及解决办法 预测的概率可能小于零,或大于预测的概率可能小于零,或大于预测的概率可能小于零,或大于预测的概率可能小于零,或大于1 1,最好是在靠,最好是在靠,最好是在靠,最好是在靠近自变量均值的地

13、方估计对成功概率的影响。近自变量均值的地方估计对成功概率的影响。近自变量均值的地方估计对成功概率的影响。近自变量均值的地方估计对成功概率的影响。 任何一个以水平值形式出现的解释变量的任何一个以水平值形式出现的解释变量的任何一个以水平值形式出现的解释变量的任何一个以水平值形式出现的解释变量的 偏效应是不变的,否则,应设置非线性关系。偏效应是不变的,否则,应设置非线性关系。偏效应是不变的,否则,应设置非线性关系。偏效应是不变的,否则,应设置非线性关系。误差项的非正态性:模型中误差项误差项的非正态性:模型中误差项误差项的非正态性:模型中误差项误差项的非正态性:模型中误差项u ui i的概率分布的概率

14、分布的概率分布的概率分布由由由由Y Y 带入的值(带入的值(带入的值(带入的值(1 1和和和和0 0)决定的。)决定的。)决定的。)决定的。异方差性将影响模型的推断,需应用加权最小异方差性将影响模型的推断,需应用加权最小异方差性将影响模型的推断,需应用加权最小异方差性将影响模型的推断,需应用加权最小二乘法二乘法二乘法二乘法GLSGLS,以消除异方差的影响;以消除异方差的影响;以消除异方差的影响;以消除异方差的影响;R R2 2 价值有限,应避免使用价值有限,应避免使用价值有限,应避免使用价值有限,应避免使用11Copyright 2003 Prentice-Hall, Inc.住房所有权与收入

15、的住房所有权与收入的WLS估计结果估计结果*除去估计值为负数和大于1的观察样本,剩余28个样本的加权最小二乘估计12Copyright 2003 Prentice-Hall, Inc.LPM问题问题1 的解决思路的解决思路定义:一个连续概率分布定义:一个连续概率分布Pi = P(Y=1| X) 1 若若 Z Zi i (X, , ) 1 Pi = Z Zi i (X, , ) 若若 0 Z Zi i (X, , ) 0* 0 和和和和 y y =0 if =0 if y y* 0* 0。如果因变量是一个在严格为正的值域上大致连续,但总体中如果因变量是一个在严格为正的值域上大致连续,但总体中如果

16、因变量是一个在严格为正的值域上大致连续,但总体中如果因变量是一个在严格为正的值域上大致连续,但总体中有一个不可忽略的部分取值为零时,如何建模?有一个不可忽略的部分取值为零时,如何建模?有一个不可忽略的部分取值为零时,如何建模?有一个不可忽略的部分取值为零时,如何建模? 35Copyright 2003 Prentice-Hall, Inc.受限连续因变量模型受限连续因变量模型 y* = b0 + xb b + u , y = max(0,y*) 即 y = y* 当 y* 0, = 0 当 y* 0 的观测值用OLS不能一致地估计,因为y 以y0 为条件的期望值等于 X与一个严格为正的项之和,

17、逆米尔斯比率是一个被漏掉的变量。38Copyright 2003 Prentice-Hall, Inc.Tobit 模型的估计(续)模型的估计(续)E(E(y| y|x x) = ) = F FF F( (x xb b/ /s s s s) )x xb b + + sfsfsfsf( ( ( (x xb b/ /s s s s) ) ) ) (9 9) 所以所以所以所以, 当当当当 y y 服从于服从于服从于服从于TobitTobit 模型时,模型时,模型时,模型时, 由于由于由于由于E(E(y| y|x x) ) 是是是是x x和和和和 的的的的 一个非线性函数,一个非线性函数,一个非线性函

18、数,一个非线性函数, 可以用极大似然估计可以用极大似然估计可以用极大似然估计可以用极大似然估计 和和和和 。39Copyright 2003 Prentice-Hall, Inc.Tobit 模型的参数的偏效应模型的参数的偏效应* * * *求求求求E(E(y| y|x x) )对连续的对连续的对连续的对连续的x xj j 的偏效应,这个导数解释了在的偏效应,这个导数解释了在的偏效应,这个导数解释了在的偏效应,这个导数解释了在y=0y=0开始的开始的开始的开始的人为什么在人为什么在人为什么在人为什么在x xj j变化时可能选择变化时可能选择变化时可能选择变化时可能选择 y0y0。 E(E(y|

19、 y|x x)/)/x xj j = = b b b bj j F FF F( (x xb b/ /s s s s) ) (1010) 称称称称 F FF F( (x xb b/ /s s s s) ) 为在上述条件下的调整因子为在上述条件下的调整因子为在上述条件下的调整因子为在上述条件下的调整因子* * 对对对对y 0 y 0 连续的连续的连续的连续的x xj j ,可对(可对(可对(可对(8 8)式左端求偏导有)式左端求偏导有)式左端求偏导有)式左端求偏导有 (1111) 称称称称 为在为在为在为在 y 0y 0时的偏效应调整因子时的偏效应调整因子时的偏效应调整因子时的偏效应调整因子* *

20、为了使为了使为了使为了使TobitTobit估计值具有可比性,应将它乘以相应的调整因子估计值具有可比性,应将它乘以相应的调整因子估计值具有可比性,应将它乘以相应的调整因子估计值具有可比性,应将它乘以相应的调整因子在在在在x xj j的均值处的大小的均值处的大小的均值处的大小的均值处的大小 或或或或 后,再比较后,再比较后,再比较后,再比较。40Copyright 2003 Prentice-Hall, Inc.Tobit 模型应用例:妇女劳动力市场参与研究模型应用例:妇女劳动力市场参与研究被解释变量:被解释变量: 妇女参与了家庭以外工作的年工作小时数妇女参与了家庭以外工作的年工作小时数 hou

21、rs解释变量:解释变量: 丈夫的收入丈夫的收入 uwifeinc (千美元千美元), 受教育年限受教育年限 educ (年)年) 过去在劳动力市场的年数过去在劳动力市场的年数 exper(年),年), 年龄年龄 age (岁)岁) 年龄低于年龄低于6岁的子女数岁的子女数 kidslt6, 年龄介于年龄介于6-18岁的子女数岁的子女数 kidsgt6 利用Mroz,1987 的数据,753个妇女的样本中,428个曾在1975年在家庭以外工作小时数的数据,另外,325个妇女的工作小时数为零。对年工作小时数进行对年工作小时数进行OLS和和Tobit 估计的误差项标准差估计估计的误差项标准差估计 75

22、0.18 1122.0241Copyright 2003 Prentice-Hall, Inc.对年工作小时数的对年工作小时数的OLS和和Tobit 估计估计 因变量:因变量:hourshours 线性模型线性模型 Tobit probit Tobit probit 自变量自变量 (OLS) ( MLE ) ( MLE )OLS) ( MLE ) ( MLE )nwifwinc nwifwinc -3.45 - 8.81 - 0.012-3.45 - 8.81 - 0.012 (2.54) (4.46) (0.005) (2.54) (4.46) (0.005)educeduc 28.76 8

23、0.65 0.13128.76 80.65 0.131 (12.95) (21.58) (0.025) (12.95) (21.58) (0.025)experexper 65.67 131.56 0.12365.67 131.56 0.123 (9.96) (17.28) (0.019) (9.96) (17.28) (0.019)experexper2 2 -0.700 -1.86 - 0.0019-0.700 -1.86 - 0.0019 (0.325) (0.54) (0.0006) (0.325) (0.54) (0.0006)age age -30.51 -54.41 - 0.05

24、3 -30.51 -54.41 - 0.053 (4.36) (7.42) (0.008) (4.36) (7.42) (0.008)kidsltkidslt6 - 442.09 - 894.02 - 0.8686 - 442.09 - 894.02 - 0.868 (58.85) (111.88) (0.119) (58.85) (111.88) (0.119)常数项常数项 1330.48 965.31 0.0361330.48 965.31 0.036 (270.78) (446.44) (0.043) (270.78) (446.44) (0.043)对数似然值对数似然值 - 3819.

25、09 - 401.30 - 3819.09 - 401.3042Copyright 2003 Prentice-Hall, Inc.从上面实证研究结果, 可以得到关于已婚妇女的 年度劳动供给的哪些结论?家庭中来自妇女以外的收入主要是丈夫的收入的影响如何?妇女自身的年粮、过去工作经历对其劳动供给的影响作用?家庭需要照顾的子女数量对妇女劳动供给的影响?归纳影响已婚妇女的年度劳动供给的主要因素。自己先分析,然后 参见教科书p519520与(10)、(11)相应的调整因子在估计值和均值处的大小 分别约为:0.451 和 0.64543Copyright 2003 Prentice-Hall, Inc.

26、Tobit 模型解释模型解释除非潜在变量除非潜在变量除非潜在变量除非潜在变量y y* * 是我们研究的重点,不能简单是我们研究的重点,不能简单是我们研究的重点,不能简单是我们研究的重点,不能简单地解释模型系数。地解释模型系数。地解释模型系数。地解释模型系数。如果误差项的条件正态性和同方差性不成立,如果误差项的条件正态性和同方差性不成立,如果误差项的条件正态性和同方差性不成立,如果误差项的条件正态性和同方差性不成立,TobitTobit 模型没有意义。模型没有意义。模型没有意义。模型没有意义。如果如果如果如果X X 对对P(y0) 和和 E(y) 的作用方向相反,的作用方向相反,那么,那么,To

27、bitTobit 模型是不适合的。模型是不适合的。模型是不适合的。模型是不适合的。44Copyright 2003 Prentice-Hall, Inc.样本选择校正样本选择校正样本选择问题 * 数据断尾 内生样本选择 (样本仅由内生因变量决定) 外生样本选择 (样本仅由外生的解释变量决定) * 非随机样本选择: 问卷调查设计导致自变量、因变量缺失, 纵列数据中一些时段部分样本缺失(某样本对象离开总体)样本选择的后果: * 外生样本选择不影响OLS应用于子样本的一致性。 * 内生样本选择有影响样本选择校正:45Copyright 2003 Prentice-Hall, Inc.截取回归模型截取

28、回归模型和断尾回归模型和断尾回归模型删节回归模型删节回归模型删节回归模型删节回归模型(Censored Regression Models(Censored Regression Models ) ) * * y yi i = = x xb b + + u u, , u ui i | |x xi i ,c ,c Normal(0, Normal(0,s s s s2 2), C ), C 为截取值为截取值为截取值为截取值将删节隐藏的变量取值的概率集中于删节点,组成一个连续将删节隐藏的变量取值的概率集中于删节点,组成一个连续将删节隐藏的变量取值的概率集中于删节点,组成一个连续将删节隐藏的变量取值

29、的概率集中于删节点,组成一个连续分布与离散分布的组合,总概率为分布与离散分布的组合,总概率为分布与离散分布的组合,总概率为分布与离散分布的组合,总概率为1 1 * * 我们只能观测我们只能观测我们只能观测我们只能观测 w w = min( = min(y,cy,c) if c ) if c 的右端被删节的右端被删节的右端被删节的右端被删节, , 或或或或 w w = max(y,c) if c = max(y,c) if c 的左端被删节的左端被删节的左端被删节的左端被删节 断尾回归模型断尾回归模型断尾回归模型断尾回归模型( ( Truncated Regression ModelsTrunc

30、ated Regression Models) ) 在截取值外,除因变量外相应的解释变量的数据都缺失的情况下,在截取值外,除因变量外相应的解释变量的数据都缺失的情况下,在截取值外,除因变量外相应的解释变量的数据都缺失的情况下,在截取值外,除因变量外相应的解释变量的数据都缺失的情况下, 上述潜在变量模型就变成断尾回归模型。即上述潜在变量模型就变成断尾回归模型。即上述潜在变量模型就变成断尾回归模型。即上述潜在变量模型就变成断尾回归模型。即 从一个总体的受限部分抽取的样本中推断总体,忽略被截去数据的从一个总体的受限部分抽取的样本中推断总体,忽略被截去数据的从一个总体的受限部分抽取的样本中推断总体,忽

31、略被截去数据的从一个总体的受限部分抽取的样本中推断总体,忽略被截去数据的 样本,样本,样本,样本, 将关心的取值范围内的概率调整为将关心的取值范围内的概率调整为将关心的取值范围内的概率调整为将关心的取值范围内的概率调整为1 1 1 146Copyright 2003 Prentice-Hall, Inc.样本选择校正:赫克曼的贡献样本选择校正:赫克曼的贡献20002000年诺贝尔奖得主年诺贝尔奖得主:James J. Heckman & Daniel L. McFaddenJames J. Heckman & Daniel L. McFadden 赫克曼年出生于美国的芝加哥,现为芝加哥大学经济

32、学教授。麦克法登年出生于美国的罗利,现供职于美国加利福尼亚大学。 他们在年代发展了已被广泛用来对个人和家庭行为进行统计分析的理论和方法。他们在年代发展了已被广泛用来对个人和家庭行为进行统计分析的理论和方法。 赫克曼赫克曼因发展了对选择性抽样数据进行分析的理论和方法。麦克法登发展了对自行因发展了对选择性抽样数据进行分析的理论和方法。麦克法登发展了对自行选择行为进行分析的理论和方法。解决了微观数据进行统计分析中出现的基本问题选择行为进行分析的理论和方法。解决了微观数据进行统计分析中出现的基本问题。 赫克曼所进行的研究发展了用一种合适的方式来处理选择性抽样数据的方法,并提赫克曼所进行的研究发展了用一种合适的方式来处理选择性抽样数据的方法,并提出了用来解决与此密切相关问题的方法出了用来解决与此密切相关问题的方法, , 他在这些领域进行的应用研究也具有领先他在这些领域进行的应用研究也具有领先地位。地位。微观数据进行统计分析中出现的基本问题微观数据进行统计分析中出现的基本问题 人们所能获得的微观数据往往来源于选择性的抽样调查数据,如有关工资的数据就无法通过随意抽样的方式获得。如果这样的选择性因素不被考虑进去,那么对经济关系进行的统计评估结果将会发生偏差。47

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号