_受限因变量模型__颜莹

资源描述

《_受限因变量模型__颜莹》由会员分享，可在线阅读，更多相关《_受限因变量模型__颜莹（7页珍藏版）》请在金锄头文库上搜索。

1、第六章受限因变量模型Chapter 6 受限因变量模型本章讨论的一类模型是被关注的因变量的取值受到限制。有时候这种限制不需要特别的处理，但有时候这种限制却是实质性的。从条件期望的角度看，如果限制的信息是确定的，例如，只取有限个离散值，如（表示赞成），（表示反对）。于是，用线性回归模型的方式来表示就不合适了。我们将依据受不同限制的情况处理几类不同的非线性模型，并给出非线性模型的常用估计检验方法极大似然方法。按理，非线性模型是下篇的内容，之所以要介绍受限因变量模型是因为它的背景与多元回归模型有关。另外，本章的附录部分简单的介绍非线性理论，这是伍书的第12章。1。离散响应模型有时，我们只能观察到

2、处于某种状态，用1表示，用0表示不处于该状态。如（就业），（失业），或仅有几种很少的状态可供选择，我们把仅取有限的离散值情况称为离散响应模型。特别，仅取0、1为值称为二元响应模型。同样，影响的状态的因素称为解释变量或相关变量，可能包括有关个体的各种情况，如教育程度，年龄，性别等，它们都有可能影响的就业状态。关注的问题：中多大程度上影响了的状态？这个问题准确的表达是，设，是一个条件概率。解释变量可以是连续型的也可以是离散型的。那么对连续变量，就用边际效应反映对状态的影响，对二元变量，（取0，1为值。）就用差分效应反映对状态的影响。以上两式，如果已知就没有问题了。问题是如何确定？（1）二元响应的

3、线性概率模型最简单的是认为仍是的线性函数，改写成：。，则。是一个二元分布。，且。，且。这说明，如果用线性投影来拟合，则存在条件异方差。（方差与样本有关）注意：采用线性概率模型，未知参数的含义，当取连续值；当取离散值，。由，利用，给定样本，。可得的一致估计。又由存在条件异方差，故不是有效的，再改用加权最小二乘（WLS）加以修正，做法是，对所有满足条件的样本，定义标准差，然后对，。做回归，得，可增加有效性。关于检验，所有关于的检验、检验以及部分参数为0的检验，用稳健的异方差协差矩阵和标准差都是有效的。但是线性概率模型在理论上是有欠缺的，因为拟合值有可能不在区间内，即使都在中，但预测值随着其解释变量

4、不断增加或减少，终将导致不在区间内，这与概率的意义是不相符的。尽管如此，如果主要目的是估计中每个解释变量对影响的平均概率，那么一些预测值不在中影响不大，线性概率模型不必对取极端值给出一个好的估计。（2）二元响应的指数（Index）模型（probit 和 logit 模型）考虑二元响应的概率有形式：。这里，。，。特别就是线性概率模型。因为先把理解成一个指数（Index），函数再把指数映射成一个响应函数。故称模型为指数模型，在实践中一般取累积分布函数的形式。如果是某一随机变量的分布函数，那么二元响应的指数模型可以从存在潜在变量的线性模型中得到解释：设，且。不可观测，但如果则可观测，是关于原点对称

5、与不相关的连续型随机变量。如果是的分布函数，那么，且。因此，。注：没有特别的理由要求是关于原点对称的。但为了方便，对二元响应模型已作为一种习惯限制。没有此限制二元响应模型就不能看成是存在潜在变量的模型。二元响应不采用存在潜在变量的说法是因为无法准确定义潜在变量的含义和测量单位，从而参数的大小也没有特定的意义。另外，一般对的要求也不非要是分布函数，只要满足在区间即可，但在实际应用时，有两个常用的选择，一个是服从标准正态分布，称Probit模型；另一个是服从标准Logistic分布，称为Logit模型。1当服从标准正态分布，则的分布函数形式为2当服从Logistic的分布，则，有性质。于是，在指

6、数模型中，的含义就不如线性概率模型那样明显。因为当连续时，且。如果是分布函数，则，。故的符号给出了对的正影响和负影响，而的大小则没有太大的增量意义。另外，当的密度关于原点对称时，取得最大值，从而在时对有最大影响。其次当是二元解释变量，那么当改变到1，其他变量不变，对产生的偏效应就是该值是依赖于其他解释变量取值，不过的符号同样能决定对产生的偏效应是正还是负。一般的，当改变到，其他变量不变，那么对产生的偏效应就是。由，有时也常用表示改变百分之一对产生的偏效应。偏效应比：，当和是连续型时，则不依赖的分布函数。（3）二元响应的极大似然估计和检验给定样本观测值，要求极值：。，。由一阶条件，即。得，。

7、这是一个关于的非线性方程组，采用非线性方程算法可求得的极大似然估计量。注：一般情况下，上述方程要有解，要求样本容量是和自变量个数及的均值满足条件。含义是，取1的个数和取0的个数都必须大于。例如都取1，则方程无解。当取标准正态公布，，。一阶条件就是表示成。又当取Logistic分布，。一阶条件就是表示成。简化成。故Logit模型在算法上要方便些。进一步可以求得，极大似然估计的协方差矩阵的估计为：。有了估计、渐近方差和标准差，我们就可以做各种假设检验。特别，部分系数为零的检验，在有极大似然函数的前提下，又可以方便的增加似然比检验LR。考察。欲检验。除了用Wald检验和LM检验外，用似然

8、比检验LR。是无约束下的极大似然估计，是带约束的极大似然估计，是的个数。又当的维数很大，用Wald检验和LR检验计算量很大，采用LM方法更为可取。记，。已从极大似然估计中获得。然后，得非中心决定系数。真下，。（该方法还可以推广到检验.）接下来讨论Probit、Logit和线性概率LP结果的比较。因为Probit、Logit和LP施加不同的变换，所以得到的极大似然估计不能简单的进行比较。因为对的一个微小变化而言，所以，为了比较增加一个单位的偏效应，我们调整归“1”。因此，如果Probit、Logit、LP而言，接近于0，那么，对Probit，；对Logit，；对LP，。所以，用与相比。同理，与相

9、比；与相比。一般的，连续，用作为总体上的平均值代替，然后再调整，进行比较。另外，二元响应模型也存在解释变量有内生性的问题，以及类似二阶段极大似然估计方法。也可以把二元响应模型扩大到面板数据模型上，。这涉及到更多非线性估计和检验的理论，这是下学期的内容，不再深入讨论下去了。（参见伍书第15章）2。截取回归模型简介因变量可能受到客观条件的限制，使其在某一范围外的数据无法得到，或是有意不取。由于结果的数据受到限制，且解释变量是在结果受限条件下获得的数据，此意味着样本和不再独立。从条件期望的角度看，即使是正确设定，但如果要限制，本质上会产生对模型中未知参数的非线性依赖。导致方法一致性不成立，不再是一个

10、好的估计，只能改用极大似然方法保证大样本下估计的一致性。因变量受限的截取回归模型通俗的说法是，因变量“掐头”或“去尾”。例如，调查个人收入只能在一定范围内得到；又例如调查寿命大于80岁以上的一般用80岁代替。另一种说法是所谓角点解，问题不再是因变量部分不可观测，而是结果依赖于最优选择，且最优选择的特征是以正的概率取0值。因为，从而我们关注时的就不再是线性的了。例如，慈善捐赠，关注的是捐赠了的那部分。我们把截取Tobit模型写成：设是正确设定，且不能完全观测。但可观测的，为“去尾”或为“掐头”。且在给定、条件下，。特别，则表示非负观测限制。也称为标准截取Tobit模型。所以，注：，那么，。称为逆

11、米尔斯比。所以，。称为标度因子。，它是给定和时正响应的概率。接近于1，截取Tobit模型与多元回归就没有太多区别。截取Tobit模型的估计与检验涉及到麻烦的非线性计算，这是下学期的内容，略。需要提出的是，截取Tobit模型有二种变形。我们知道，截取Tobit模型对解释变量是没有任何限制的。一种变形是，因变量的受限导致了的样本受限，甚至是有意不取。我们将此处理成Probit的响应形式。模型：，且。假定：是一个二元选择变量，当时等于1。受限于，只有时才是可观测的。是的子集，且和可观测。又，与、不相关，且。注：这里关注的模型尽管是线性多元回归，但样本和都受到限制。另一种变形是Tobit的响应形式。模型：，且。假定：是一个截取选择变量，受限于，只有当时才是可观测的。是的子集，且和可观测。又，与、不相关，但，且。关于模型的背景、估计和检验都是下学期的内容，不再讨论下去了。要提醒的是，这些非线性模型都是多元回归模型受到约束变形而来。6

展开阅读全文