连玉君_logit模型stata

上传人:n**** 文档编号:88915006 上传时间:2019-05-13 格式:PDF 页数:38 大小:683.45KB
返回 下载 相关 举报
连玉君_logit模型stata_第1页
第1页 / 共38页
连玉君_logit模型stata_第2页
第2页 / 共38页
连玉君_logit模型stata_第3页
第3页 / 共38页
连玉君_logit模型stata_第4页
第4页 / 共38页
连玉君_logit模型stata_第5页
第5页 / 共38页
点击查看更多>>
资源描述

《连玉君_logit模型stata》由会员分享,可在线阅读,更多相关《连玉君_logit模型stata(38页珍藏版)》请在金锄头文库上搜索。

1、计量分析与 STATA 应用 钟经樊 连玉君 关于作者: 钟经樊 台湾中央研究院 经济研究所 连玉君中山大学 岭南学院 金融系 中文版本: 版本 2.0,二一年六月 II 钟经樊和连玉君拥有版权 c ? 2007 2010。 保留所有权利。 这份文档是我们即将出版的书稿,目前免费提供给中山大学岭南学院的师生使用。 发布这份文档的目的有二: 其一,用做授课讲义,帮助岭南学院的同学们学习 STATA; 其二,恳请大家对书稿提出修改意见,包括书稿的结构安排、表述错误,以及错别字等细节。 书稿的使用仅限于岭南学院范围内,请勿外传或散布于网络。 目录 第十五章Logistic 模型1 15.1 简介 .

2、 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1 15.2 二元 Logit 模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1 15.2.1 二项分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1 15.2.2 Logit 变换. . . . .

3、. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .2 15.2.3 Logistic 模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .2 15.2.4 估计. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .3 15.2.5 假设检验. . . . . . . . . . . . . . . . . . . . .

4、. . . . . . . . . . . . . . . .6 15.2.6 模型的解释和拟合优度 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .7 15.3 多元 Logit 模型. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .12 15.3.1 估计. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .12 15.

5、3.2 假设检验 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .18 15.3.3 拟合优度 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .27 15.3.4 模型的解释. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .28 15.4 STATA 中有关 Logitech 模型的命令概览. . .

6、. . . . . . . . . . . . . . . . . . . . .33 III 第十五章 Logistic 模型 15.1简介 在过去的二十年中,logistic 模型在众多领域得到了广泛的应用,甚至成为部分领域的标 准分析方法。 logistic 模型与线性模型的最大区别就在于前者的被解释变量是二元变量 (binary) 或取值有限的离散变量 (dichotomous)。这种区别使得两种模型的参数设定和假设条件都存在差 异。在充分考虑这些差异的前提下,前面介绍的用于分析线性模型的基本规则同样适用于分析 logistic 模型。当然,由于 logistic 模型的非线性特征,在

7、分析过程中还需要引入一些新的统计 和评估方法。 15.2二元 Logit 模型 15.2.1二项分布 假设我们想要研究上市公司债务融资行为的决定因素,被解释变量 yi为上市公司是否发行 债务。显然,yi是一个二元变量,只有 0 和 1 两个取值,定义如下: yi= ( 1若第 i 家公司发行债务 0其它 (15-1) 我们可以将 yi视为随机变量 Yi的实现值,Yi有 1 和 0 两个取值,相应的概率分别为 i和 1 i。 Yi服从贝努力 (Bernoulli) 分布,参数为 i,可表示为 Pr ?Y i= yi ? = yi i (1 i)1yi,其中, yi= 0,1.(15-2) 显然,

8、若 yi= 1,则上式为 i;若 yi= 0,则上式为 1 i。 易于证明,Yi的期望和方差分别为: E(Yi)=i= i Var(Yi)=i= i(1 i) 1 15.2 二元 LOGIT 模型2 可见,期望和方差都决定于 i。任何影响概率的因素不但会影响观察值的的均值,也会影响其 方差。这表明前面介绍的线性模型无法用于分析二元变量,因为线性模型假设方差是固定不变 的。 15.2.2Logit 变换 线性变换 为了使上述模型更富有弹性,我们假设概率 i受一系列变量的影响,设定为 xi。 一个非 常直觉的想法是把二者之间的关系设定为线性函数: i= x0i , 其中, 为系数向量。该模型通 常

9、称为线性概率模型,采用普通最小二乘法估计即可。 其主要缺陷在于:由于等式左边的 i表示概率,所以必须介于 0 和 1 之间,而右边的线性 组合项则可能取任何值,所以在不对模型做严格约束的情况下,我们很难保证模型的预测值介 于合理的范围内。 logit 变换 因此,我们必须对概率 i进行变换以消除对其取值范围的约束,继而把变换后的数值 设 定为解释变量 xi的线性函数。处理过程包括两个步骤。 第一步,我们依据概率 i来定义胜算比(odds) : ?i= i 1 i ,(15-4) 即 yi= 1 的概率 i与 yi= 0 的概率 (1 i) 的比值。显然,胜算比可以取任意非负值,如此便 可消除上

10、限约束。 第二步,取对数以计算 logit 或 log-odds logit(i) = ln(?i) = ln ? i 1 i ? (15-5) 这样我们就可以去除下限约束。因为,随着概率 i趋近于 0 ,logit 将趋近于 ; 而当概率 i趋近于 1 ,logit 将趋近于 + 。因此,通过以上变换,logit 将概率 i的取值范围从 (0, 1) 映 射至整个实数轴。显然,如果概率为 0.5,胜算比为 1,相应的 logit 为 0。logit 为负表示概率小 于 0.5,反之则表示概率大于 0.5。图 15-1 说明了上述变换的对应关系。 15.2.3Logistic 模型 在完成了上

11、述变换后,我们就可以定义 Logistic 回归模型了,此时我们假设概率 i的 Logit 变换 (而非概率 i本身) 服从线性模型,即 logit(i) = ln ? i 1 i ? = x0i ,(15-6) 其中,xi为解释变量构成向量, 为系数向量。 第十五章 LOGISTIC 模型3 0 20 40 60 80 100 Odds 0.2.4.6.81 Probability 0 .2 .4 .6 .8 1 Probability 42024 Logit (logodds) 图 15-1: logit 变换 由于 logit 变换是一一对应的,所以我们可以通过求取逆对数由 Logit

12、反向得到概率值 (通常 称为 antilogit)。 由 (15-6) 式可解得: (xi) = exp(x0i ) 1 + exp(x0i ). (15-7) 进一步,将被解释变量表示为: yi= (xi) + i.(15-8) 其中,i为随机干扰项,有两个可能的取值。 若 yi= 1,则 i= 1 (xi),相应的概率为 (xi); 若 yi= 0,则 i= (xi),相应的概率为 1 (xi)。因此, 服从均值为 0,方差为 (xi)1 (xi) 的分布。 综合上面的介绍,可以看出当被解释变量是离散变量时: (1) 模型的条件均值必须限定于 0 和 1 之间。显然,(15-5) 的 lo

13、git 变换满足这一约束条件; (2) 干扰项服从二项分布,而非正态分布,且其分布受所分析样本的具体情况的影响; (3) 分析线性模型的基本准则同样适用于分析 logit 模型。 15.2.4估计 二元 logit 模型可以采用最大似然法 (MLE) 进行估计。式 (15-7) 定义了给定 x 的情况下 Y = 1 的条件概率 (xi),记为 P(Y = 1|x)。同样,1 (x) 表示在给定 x 的情况下,Y = 0 的 条件概率。因此,第 i 个观察值对应的似然函数为: (xi)yi1 (xi)1yi.(15-9) 15.2 二元 LOGIT 模型4 假设所有观察值都是彼此独立的,则样本似

14、然函数为所有观察值对应的似然函数之积: L( ) = n Y i=1 (xi)yi1 (xi)1yi.(15-10) 我们的目的在于求得使 (15-10) 式最大时对应参数估计值 。 为了方便求解,定义对数似 然函数: ln L( ) = n X i=1 n yiln(xi) + (1 yi)ln1 (xi) o (15-11) 一阶条件为: ln L( ) = n X i=1 (yi i)xi= 0.(15-12) 由 (15-12) 式可知:(1) 若 xi中包含常数项,则 i= yi,即预测概率的平均值等于样本中 yi= 1 的比例。 (2) 如果我们将 yi i看作一般化残差 (gen

15、eralized residual),则 (15-12) 式与线性回归 模型中的正交条件具有相似的含义。 采用牛顿迭代法可以很方便地得到参数的估计值。我们可以进一步求取二阶偏导如下: H( ) = 2ln L 0 = n X i=1 i(1 i)xix0i.(15-13) 通常把 H 称为海赛矩阵 (Hessian)。由于 Hessian 始终为负定矩阵,所以对数似然函数可以在几 次迭代后便达到全局收敛。 参数的方差-协方差矩阵可以利用 Hessian 的逆矩阵求得,即 Var( ) = H1( ).(15-14) 在多数情况下,我们都很难写出该矩阵的具体形式。 因此,我们将该矩阵的第 j 个对角元 素记为 Var(j),它是 j的方差;用 Cov(j,l) 表示任意非对角元素,它是 j和 l的协方 差。 因此,方差-协方差矩阵的估计值可表示为 Var( )。 我们采用 Var(j) 和 Cov(j, l), j,l = 0,1,2, ,k 表示该矩阵中的元素。至此,系数的标准误可求取如下: se(j) = q Var(j),for j = 0,1,2, ,k.(15-15) 在 Stata 中,Logit 模型均采用最大似然法 (MLE) 进行估计。虽然在大样本下,ML 估计 量是一致、有

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号