高级计量第7章 离散模型

上传人:n**** 文档编号:53970182 上传时间:2018-09-06 格式:PPT 页数:128 大小:1.50MB
返回 下载 相关 举报
高级计量第7章 离散模型_第1页
第1页 / 共128页
高级计量第7章 离散模型_第2页
第2页 / 共128页
高级计量第7章 离散模型_第3页
第3页 / 共128页
高级计量第7章 离散模型_第4页
第4页 / 共128页
高级计量第7章 离散模型_第5页
第5页 / 共128页
点击查看更多>>
资源描述

《高级计量第7章 离散模型》由会员分享,可在线阅读,更多相关《高级计量第7章 离散模型(128页珍藏版)》请在金锄头文库上搜索。

1、第七章 离散变量计量经济模型,7.1 二元选择模型,一、二元离散选择模型的经济背景 二、二元离散选择模型 三、二元Probit离散选择模型及其参数估计 四、二元Logit离散选择模型及其参数估计 五、二元离散选择模型的检验,在经典计量经济学模型中,被解释变量通常被假定为连续变量。 离散被解释变量数据计量经济学模型(Models with Discrete Dependent Variables)和离散选择模型(DCM, Discrete Choice Model)。 二元选择模型(Binary Choice Model)和多元选择模型(Multiple Choice Model)。,研究选择结

2、果与影响因素之间的关系。 选择结果:0、1 影响选择结果的因素包括两部分:决策者的属性和备选方案的属性。,实际经济生活中的二元选择问题,一、二元离散选择模型的经济背景,两种方案的选择 由决策者的属性和备选方案的属性共同决定。 例如,选择利用公共交通工具还是私人交通工具,取决于两类因素。一类是公共交通工具和私人交通工具所具有的属性,诸如速度、耗费时间、成本等;一类是决策个体所具有的属性,诸如职业、年龄、收入水平、健康状况等。 从大量的统计中,可以发现选择结果与影响因素之间具有一定的因果关系。,单个方案的取舍 一般由决策者的属性决定。 例如,对某种商品的购买决策问题。决定购买与否,取决于两类因素。

3、一类是该商品本身所具有的属性,诸如性能、价格等;一类是消费者个体所具有的属性,诸如收入水平、对该商品的偏好程度等。 对于所有的决策者,商品本身所具有的属性是相同的,在模型中一般不予体现。,二、二元离散选择模型,1、原始模型,对于二元选择问题,可以建立如下计量经济学模型。其中Y为观测值为1和0的决策被解释变量;X为解释变量,包括选择对象所具有的属性和选择主体所具有的属性。,左右端矛盾,由于存在这两方面的问题,所以原始模型不能作为实际研究二元选择问题的模型。 需要将原始模型变换为效用模型。 这是离散选择模型的关键。,具有异方差性,2、效用模型,作为研究对象的二元选择模型,第i个个体 选择1的效用,

4、第i个个体 选择0的效用,注意,在模型中,效用是不可观测的,人们能够得到的观测值仍然是选择结果,即1和0。 很显然,如果不可观测的U1U0,即对应于观测值为1,因为该个体选择公共交通工具的效用大于选择私人交通工具的效用,他当然要选择公共交通工具; 相反,如果不可观测的U1U0,即对应于观测值为0,因为该个体选择公共交通工具的效用小于选择私人交通工具的效用,他当然要选择私人交通工具。,3、最大似然估计,欲使得效用模型可以估计,就必须为随机误差项选择一种特定的概率分布。 两种最常用的分布是标准正态分布和逻辑(logistic)分布,于是形成了两种最常用的二元选择模型Probit模型和Logit模型

5、。 最大似然函数及其估计过程如下:,标准正态分布或逻辑分布的对称性,似然函数,在样本数据的支持下,如果知道概率分布函数和概率密度函数,求解该方程组,可以得到模型参数估计量。,1阶极值条件,1、标准正态分布的概率分布函数,三、二元Probit离散选择模型及其参数估计,2、重复观测值不可以得到情况下二元Probit离散选择模型的参数估计,关于参数的非线性函数,不能直接求解,需采用完全信息最大似然法中所采用的迭代方法。,这里所谓“重复观测值不可以得到”,是指对每个决策者只有一个观测值。如果有多个观测值,也将其看成为多个不同的决策者。,例7.2.2 贷款决策模型,分析与建模:某商业银行从历史贷款客户中

6、随机抽取78个样本,根据设计的指标体系分别计算它们的“商业信用支持度”(CC)和“市场竞争地位等级”(CM),对它们贷款的结果(JG)采用二元离散变量,1表示贷款成功,0表示贷款失败。目的是研究JG与CC、CM之间的关系,并为正确贷款决策提供支持。,样本观测值,CC=XY CM=SC,该方程表示,当CC和CM已知时,代入方程,可以计算贷款成功的概率JGF。例如,将表中第19个样本观测值CC=15、CM=1代入方程右边,计算括号内的值为0.1326552;查标准正态分布表,对应于0.1326552的累积正态分布为0.5517;于是,JG的预测值JGF=10.5517=0.4483,即对应于该客户

7、,贷款成功的概率为0.4483。,输出的估计结果,累计正态分布密度函数,模拟预测,预测:如果有一个新客户,根据客户资料,计算的“商业信用支持度”(XY)和“市场竞争地位等级”(SC),代入模型,就可以得到贷款成功的概率,以此决定是否给予贷款。,3、重复观测值可以得到情况下二元Probit离散选择模型的参数估计,思路 对每个决策者有多个重复(例如10次左右)观测值。 对第i个决策者重复观测ni次,选择yi=1的次数比例为pi,那么可以将pi作为真实概率Pi的一个估计量。 建立 “概率单位模型” ,采用广义最小二乘法估计 。,对第i个决策者重复观测n次,选择yi=1的次数比例为pi,那么可以将pi

8、作为真实概率Pi的一个估计量。,定义“观测到的”概率单位,泰勒展开,只保留一阶项,V的观测值通过求解标准正态分布的概率分布函数的反函数得到,实际观测得到的,采用广义最小二乘法,其中为U的方差-协方差矩阵,在实际估计过程中用它的估计量代替,该估计量是由Pi的估计量pi构成。,四、二元Logit离散选择模型及其参数估计,1、逻辑分布的概率分布函数,Brsch-Supan于1987年指出:,如果选择是按照效用最大化而进行的,具有极限值的逻辑分布是较好的选择,这种情况下的二元选择模型应该采用Logit模型。,2、重复观测值不可以得到情况下二元logit离散选择模型的参数估计,关于参数的非线性函数,不能

9、直接求解,需采用完全信息最大似然法中所采用的迭代方法。 应用计量经济学软件。,Probit 0.999999 1.000000 0.447233 0.000000,3、重复观测值可以得到情况下二元logit离散选择模型的参数估计,思路 对每个决策者有多个重复(例如10次左右)观测值。 对第i个决策者重复观测ni次,选择yi=1的次数比例为pi,那么可以将pi作为真实概率Pi的一个估计量。 建立“对数成败比例模型” ,采用广义最小二乘法估计 。,用样本重复观测得到的pi构成“成败比例”,取对数并进行台劳展开,有,逻辑分布的概率分布函数,采用广义最小二乘法,由Pi的估计量pi构成,为了提高估计量的

10、质量,可采用迭代法反复求得Pi的估计量,五、二元离散选择模型的检验 主要的检验包括拟合优度检验、总体显著性检验、变量显著性检验、预测(回代)效果检验、异方差性检验和省略变量检验。,1、计量经济学模型中的两类检验统计量,基于LS (其统计量大多是基于残差平方和而构建的) R2 总体显著性F检验 约束回归的F检验 基于ML(其统计量大多是基于似然函数值而构建的) Wald LR (likelihood ratio) LM (lagrange multiplier) 原理相同,2、拟合优度检验,P:样本观测值中被解释变量等于1的比例。L:模型估计得到的似然函数值。 R2=1,即L=1,完全拟合。R2

11、=0,所有解释变量完全不显著,完全不拟合。,设L0为模型中所有解释变量的系数都为0时的似然函数值,则有,LnL=1.639954 LnL0=52.80224 R2=0.968942,3、 总体显著性检验,例中,lnL=1.639954,lnL0= 52.80224,LR=102.3246。20.01(2)=9.21。 可见,在0.01的显著水平上,该模型拒绝总体不显著的0假设。,4、回代检验,当二元离散选择模型被估计后,将所有样本的解释变量观测值代入模型,计算得到每个样本的被解释变量选择1的概率,与每个样本被解释变量的实际观测值进行比较,以判断模型的预测(回代)效果,是一种实际有效的模型检验方

12、法。,4、回代检验,4、回代检验,概率阈值 朴素选择:p=0.5 (1、0的样本相当时) 先验选择:p=(选1的样本数/全部样本)(全样本时) 最优阈值:犯第一类错误最小原则,例7.2.2,如果按照朴素原则,例中,除了2个样本外,所有样本都通过了回代检验。没有通过回代检验的2个样本中,第19个样本的选择结果为1,回代算得的选择1的概率为0.4472;第45个样本的选择结果为0,回代算得的选择1的概率0.5498。 但是,该例中,选择1和选择0的样本数目分别为32和46,差异较大,不适合采用该方法。,如果按照先验方法,即以全部样本中选择1的样本所占的比例为临界值。例中,选择1的样本的比例为0.4

13、1。以此为临界值,只有第45个样本不能通过检验。 但是,该方法适合于以全部个体作为样本的情况,而该例中的78个样本仅是贷款客户的极少部分,所以也不适合采用该方法。,如果按照最优方法,即以“犯第一类错误最小”为原则确定临界值的方法。在例中,如果以0.50为临界值,则有2个样本发生“弃真”,即犯第一类错误;如果以0.41为临界值,则发生“弃真”的样本只有1个。所以以0.41作为临界值比较合适。,7.2 多元选择模型,一、社会经济生活中的多元选择问题 二、一般多元离散选择Logit模型 三、嵌套Logit模型 四、排序多元离散选择模型,可以将社会经济生活中的多元选择问题分为三类: 一般多元选择问题

14、排序选择问题(Ordered Multivariate Choice ) 嵌套选择问题(Nested Multiple Choices),一、社会经济生活中的多元选择问题,一般多元选择问题 决策者按照效用最大原则在多个可供选择的方案中进行选择。 一类问题是决策者面临多项选择 一类问题是决策者对同一个选择对象的偏好程度,排序选择问题 决策者作出某种选择并不意味实现了效用最大,而是在条件制约下的无奈选择。 一个典型的例子是商品的满意度调查。 将对商品的满意度分为5等:十分满意、一般满意、无所谓、一般不满意、十分不满意,对已经购买了该商品的居民进行调查,会有不同的满意程度,该调查结果就是一个排序选择

15、问题。,嵌套选择问题 选择对象是分层次的,决策者必须逐层进行选择。,在多元离散选择模型中,应用最多的是Logit模型。 在多元离散选择模型中,因为Probit模型需要对多元正态分布的整体进行评价,所以它的应用受到限制。 逻辑分布更适合于效用最大化时的分布选择,所以应用最多的多元离散选择模型是Logit模型。 Logit模型的似然函数能够快速可靠地收敛,当方案或者决策个体数量较大时,计算比较简便。,二、一般多元离散选择Logit模型,1、一般多元选择Logit模型的思路,如果决策者i在(J+1)项可供选择方案中选择了第j项,那么其效用模型为:,当且仅当(J+1)个随机误差项互不相关,并且服从We

16、ibul类极值分布,选择j的概率,效用模型的解释变量中包括所有影响选择的因素,既包括决策者所具有的属性,也包括备选方案所具有的属性。 备选方案所具有的属性是随着方案的变化而变化的。 决策者所具有的属性中一部分是随着方案的变化而变化的,而一部分是不随着方案的变化而变化的。 用Zij表示随着方案的变化而变化的那部分解释变量,Wi表示不随着方案的变化而变化的那部分解释变量。,实用的一般多元Logit选择模型又分3种情况。 一是研究选择某种方案的概率与决策者的特征变量之间的关系; 二是研究选择某种方案的概率与决策者的特征变量以及方案的特征变量之间的关系; 三是考虑到不同方案之间的相关性的情况。,Multinomial Logit Model 多项Logit模型 名义Logit模型,Conditional Logit Model 条件Logit模型,Nested Logit模型 嵌套模型,2、多项Logit离散选择模型及其参数估计,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 电子/通信 > 综合/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号