《离散选择模型》由会员分享,可在线阅读,更多相关《离散选择模型(44页珍藏版)》请在金锄头文库上搜索。
1、第八章(续) 离散选择模型一、问题的提出例8.1 研究家庭是否购买住房。由于,购买住房行为要受到许多因素的影响,不仅有家庭收入、房屋价格,还有房屋的所在环境、人们的购买心理等,所以人们购买住房的心理价位很难观测到,但我们可以观察到是否购买了住房,即 例8.2 分析公司员工的跳槽行为。员工是否愿意跳槽到另一家公司,取决于薪资、发展潜力等诸多因素的权衡。员工跳槽的成本与收益是多少,我们无法知道,但我们可以观察到员工是否跳槽,即例8.3 对某项建议进行投票。建议对投票者的利益影响是无法知道的,但可以观察到投票者的行为只有三种,即从上述被解释变量所取的离散数据看,如果被解释变量只有两个选择,则建立的模
2、型为二元离散选择模型,又称二元型响应模型;如果变量有多于二个的选择,则为多元选择模型。本章主要介绍二元离散选择模型。1962年,Warner首次将它应用于经济研究领域,用于研究公共交通工具和私人交通工具的选择问题。70-80年代,离散选择模型被普遍应用于经济布局、企业选点、交通问题、就业问题、购买行为等经济决策领域的研究。本章内容8.1 线性概率模型(LPM)8.2 Logit模型8.3 Probit模型二、线性概率模型1、线性概率模型的概念。设家庭购买住房的选择主要受到家庭的收入水平,则用如下模型表示其中 为家庭的收入水平, 为家庭购买住房的选择,即给定解释变量, 被解释变量Y的分布为因此,
3、 家庭选择购买住房的概率是解释变量-家庭收入的一个线性函数。我们称这一关系式为线性概率函数。Y01概率1-pp2、线性概率函数的估计(麻烦!)(1)随机误差项的非正态性表现 给定解释变量, 随机扰动项仅取两个值.(2) 的异方差性问题: 如何修正?(3)、 可能不成立5.2 Logit模型一、Logit模型的产生1、产生Logit模型的背景对于线性概率模型来说,存在一些问题(1)古典假定不再成立(2)(3)经济意义也不能很好地得到体现购买住房的可能性与收入之间应该是一种非线性关系2、Logit模型的含义(1)随着 的减小, 趋近0的速度会越来越慢;反过来随着 的增大, 接近1的速度也越来越慢,
4、而当 增加很快时, 的变化会比较快。故 与 之间应呈非线性关系。(2) 的变化始终在0和1之间(3)设(4)Logit模型其中 为机会概率比(简称机会比,下同),即事件发生与不发生所对应的概率之比。称(*)式为Logit模型3、Logit模型的特点二、Logit模型的估计2、最大似然估计方法。 在线性回归中估计总体未知参数时主要采用OLS方法,这一方法的原理是根据线性回归模型选择参数估计,使被解释变量的观测值与模型估计值之间的离差平方值为最小。而最大似然估计方法则是统计分析中常用的经典方法之一,在线性回归分析中最大似然估计法可以得到与最小二乘法一致的结果。但是,与最小二乘法相比,最大似然估计法
5、既可以用于线性模型,又可以用于非线性模型,由于Logit回归模型是非线性模型,因此,最大似然估计法是估计Logit回归模型最常用的方法。下面,以单变量为例,说明具体的估计方法。将上式两端取对数得 Logit回归最大似然估计的统计性质(1)参数估计具有一致性,即当样本观测增大时,模型的参数估计值将比较接近参数的真值。(2)参数估计为渐近有效,即当样本观测增大时,参数估计的标准误相应减小。(3)参数估计满足渐近正态性,即随着样本观测的增大,估计的分布近似于正态分布。这意味着,可以利用这一性质对未知参数进行假设检验和区间估计了。三、Logit 回归模型的评价和参数的统计检验1、模型的拟合优度检验组,
6、或者一个观测数据的 数值为1,并且属于第2组,就称这个观测数据是分组恰当的,否则就称这个观测数据是分组不恰当的。如果模型估计与实际观测数据比较一致,则大多数的观测数据应该是分组恰当的,反之,如果分组不恰当的观测数据所占的比重很大,说明模型估计与实际观测数据的拟合程度较差,模型需要调整。因此,该方法的思想是利用分组恰当与否,得到观测数据占总样本的比重来检验模型的拟合优度。2、参数的显著性检验。对模型中参数的显著性检验,就是决策判断某个解释变量对事件的发生(即选取 )是否有显著性影响。如果检验结果表明该解释变量对选取 的发生有显著性影响,则认为将该解释变量放入Logit回归模型中是恰当的。否则,需
7、要对模型进行适当的调整。例 分析某种教学方法对成绩影响的有效性,被解释变量GRADE为接受新教学方法后成绩是否改善,如果改善取1,否则取0;GPA为平均分数;TUCE为测验得分;PSI为是否接受新教学方法,如果接受取1,否则取0。运用EViews软件中Logit模型估计方法得到如下结果解释。一个解释变量的作用如果是增加对数发生比的话,也就增加了事件发生的概率。具体来讲, Logit模型的系数如果是正的并且统计显著,则在控制其它变量的情况下,对数发生比对数发生比随对应的解释变量值增加而增加,相反,一个显著的负系数代表对数发生比对数发生比随对应解释变量的增加而减少。如果系数的统计性质不显著,说明对应解释变量的作用在统计上与0无差异。1、按发生比率来解释Logit模型的系数。对Logit模型的回归系数进行解释时,很难具体把握以对数单位测量的作用幅度,所以通常是将Logit作用转换成对应的发生比来解释。设模型为5.3 Probit Model例 在前述新教学方法的例子里,运用Eviews软件里的Probit模型估计方法得到如下结果