二元离散选择模型PPT幻灯片课件

资源描述

《二元离散选择模型PPT幻灯片课件》由会员分享，可在线阅读，更多相关《二元离散选择模型PPT幻灯片课件（55页珍藏版）》请在金锄头文库上搜索。

1、第2节离散被解释变量计量经济学模型二元选择模型ModelswithDiscreteDependentVariables BinaryChoiceModel 一社会经济生活中的二元选择问题二二元离散选择模型三二元Probit离散选择模型及其参数估计四二元Logit离散选择模型及其参数估计五二元离散选择模型的检验 1 说明离散被解释变量数据计量经济学模型 ModelswithDiscreteDependentVariables 和离散选择模型 DCM DiscreteChoiceModel 的区别二元选择模型 BinaryChoiceModel 和多元选择模型 MultipleCh

2、oiceModel 本节只介绍二元选择模型 2 离散选择模型起源于Fechner于1860年进行的动物条件二元反射研究 1962年 Warner首次将它应用于经济研究领域用以研究公共交通工具和私人交通工具的选择问题 70 80年代离散选择模型被普遍应用于经济布局企业定点交通问题就业问题购买决策等经济决策领域的研究模型的估计方法主要发展于80年代初期 3 一社会经济生活中的二元选择问题 4 研究选择结果与影响因素之间的关系选择结果 0 1影响选择结果的因素包括两部分决策者的属性和备选方案的属性 5 两种方案的选择由决策者的属性和备选方案的属性共同决定例如选择利用公共交通工

3、具还是私人交通工具取决于两类因素一类是公共交通工具和私人交通工具所具有的属性诸如速度耗费时间成本等一类是决策个体所具有的属性诸如职业年龄收入水平健康状况等从大量的统计中可以发现选择结果与影响因素之间具有一定的因果关系 6 单个方案的取舍一般由决策者的属性决定例如对某种商品的购买决策问题决定购买与否取决于两类因素一类是该商品本身所具有的属性诸如性能价格等一类是消费者个体所具有的属性诸如收入水平对该商品的偏好程度等对于所有的决策者商品本身所具有的属性是相同的在模型中一般不予体现 7 二二元离散选择模型 8 1 原始模型对于二元选择问题可以建立

4、如下计量经济学模型其中Y为观测值为1和0的决策被解释变量 X为解释变量包括选择对象所具有的属性和选择主体所具有的属性左右端矛盾 9 由于存在这两方面的问题主要是模型左右端矛盾问题导致原始模型不能作为实际研究二元选择问题的模型需要将原始模型变换为效用模型一般教科书称为潜变量模型 LatentVariableModel 这是离散选择模型的关键具有异方差性 10 2 效用模型作为研究对象的二元选择模型第i个个体选择1的效用第i个个体选择0的效用 11 注意在效应模型中被解释变量是不可观测的潜变量人们能够得到的观测值仍然是选择结果即1和0 很显然如果不可观测的U1 U

5、0 即对应于观测值为1 因为该个体选择公共交通工具的效用大于选择私人交通工具的效用他当然要选择公共交通工具相反如果不可观测的U1 U0 即对应于观测值为0 因为该个体选择公共交通工具的效用小于选择私人交通工具的效用他当然要选择私人交通工具 OLS不能用于效用模型的估计 12 3 最大似然估计欲使得效用模型可以采用ML估计就必须为随机误差项选择一种特定的概率分布两种最常用的分布是标准正态分布和逻辑 logistic 分布于是形成了两种最常用的二元选择模型 Probit模型和Logit模型最大似然函数及其估计过程如下 13 标准正态分布或逻辑分布的对称性似然函数 14 在样本数

6、据的支持下如果知道概率分布函数和概率密度函数求解该方程组可以得到模型参数估计量 1阶极值条件 15 三二元Probit离散选择模型及其参数估计 16 1 标准正态分布的概率分布函数 17 2 重复观测值不可以得到情况下二元Probit离散选择模型的参数估计 18 关于参数的非线性函数不能直接求解需采用完全信息最大似然法中所采用的迭代方法应用计量经济学软件这里所谓重复观测值不可以得到是指对每个决策者只有一个观测值如果有多个观测值也将其看成为多个不同的决策者 19 3 例题贷款决策模型分析与建模某商业银行从历史贷款客户中随机抽取78个样本根据设计的指标体系分别计算它

7、们的商业信用支持度 XY 和市场竞争地位等级 SC 对它们贷款的结果 JG 采用二元离散变量 1表示贷款成功 0表示贷款失败目的是研究JG与XY SC之间的关系并为正确贷款决策提供支持 20 样本观测值 21 选择Probit模型 22 估计结果 23 输出的估计结果该方程表示当XY和SC已知时代入方程可以计算贷款成功的概率JGF 例如将表中第19个样本观测值XY 15 SC 1代入方程右边计算括号内的值为0 1326552 查标准正态分布表对应于0 1326552的累积正态分布为0 5517 于是 JG的预测值JGF 1 0 5517 0 4483 即对应于该客户贷款

8、成功的概率为0 4483 24 正确解读该结果十分重要讨论能否说当市场竞争地位等级提高1 给该企业贷款成功的概率提高5 062 不能为什么能否说对于不同的企业当市场竞争地位等级都提高1 给这些企业贷款成功的概率所提高的幅度是相同的不能为什么 25 模拟预测 26 预测如果有一个新客户根据客户资料计算的商业信用支持度 XY 和市场竞争地位等级 SC 代入模型就可以得到贷款成功的概率以此决定是否给予贷款 27 4 重复观测值可以得到情况下二元Probit离散选择模型的参数估计思路对每个决策者有多个重复例如10次左右观测值对第i个决策者重复观测ni次选择yi

9、1的次数比例为pi 那么可以将pi作为真实概率Pi的一个估计量建立概率单位模型采用广义最小二乘法估计实际中并不常用 28 对第i个决策者重复观测n次选择yi 1的次数比例为pi 那么可以将pi作为真实概率Pi的一个估计量定义观测到的概率单位 29 V的观测值通过求解标准正态分布的概率分布函数的反函数得到实际观测得到的 30 四二元Logit离散选择模型及其参数估计 31 1 逻辑分布的概率分布函数 32 2 重复观测值不可以得到情况下二元logit离散选择模型的参数估计关于参数的非线性函数不能直接求解需采用完全信息最大似然法中所采用的迭代方法应用计量经济学软件 33

10、 34 35 36 37 3 重复观测值可以得到情况下二元logit离散选择模型的参数估计思路对每个决策者有多个重复例如10次左右观测值对第i个决策者重复观测ni次选择yi 1的次数比例为pi 那么可以将pi作为真实概率Pi的一个估计量建立对数成败比例模型采用广义最小二乘法估计实际中并不常用 38 用样本重复观测得到的pi构成成败比例取对数并进行台劳展开有逻辑分布的概率分布函数 39 五二元离散选择模型的检验 40 1 拟合检验 P 样本观测值中被解释变量等于1的比例 L0 模型中所有解释变量的系数都为0时的似然函数值 LRI 1 即L 1 完全拟合 LRI 0 所

11、有解释变量完全不显著完全不拟合 41 LnL 1 639954LnL0 52 80224LRI 0 968942 42 2 总体显著性检验例中 lnL 1 639954 lnL0 52 80224 LR 102 3246 20 01 2 9 21 可见在0 01的显著水平上该模型拒绝总体不显著的0假设 43 3 异方差性检验截面数据样本容易存在异方差性假定异方差结构为采用LM检验将解释变量分为两类 Z为只与个体特征有关的变量显然异方差与这些变量相关将异方差检验问题变为一个约束检验问题 44 由于一般都存在异方差不检验直接采用White修正进行估计 45 46 4 分布

12、检验检验关于分布的假设 probit logit 一般不进行该项检验具体见相关教科书 Greene P682 47 模型1的参数模型2的参数组合模型的似然函数构造LM统计量如果不拒绝0假设表明模型1是适当的 48 5 回代检验概率阈值朴素选择 p 0 5 1 0的样本相当时先验选择 p 选1的样本数全部样本全样本时最优阈值犯第一类错误最小原则 49 如果按照朴素原则例中除了2个样本外所有样本都通过了回代检验没有通过回代检验的2个样本中第19个样本的选择结果为1 回代算得的选择1的概率为0 4472 第45个样本的选择结果为0 回代算得的选择1的概率0 549

13、8 但是该例中选择1和选择0的样本数目分别为32和46 差异较大不适合采用该方法 50 如果按照先验方法即以全部样本中选择1的样本所占的比例为临界值例中选择1的样本的比例为0 41 以此为临界值只有第45个样本不能通过检验但是该方法适合于以全部个体作为样本的情况而该例中的78个样本仅是贷款客户的极少部分所以也不适合采用该方法 51 如果按照最优方法即以犯第一类错误最小为原则确定临界值的方法在例中如果以0 50为临界值则有2个样本发生弃真即犯第一类错误如果以0 41为临界值则发生弃真的样本只有1个所以以0 41作为临界值比较合适 52 其它实例财

14、务欺诈识别模型建立我国上市公司财务欺诈识别模型样本年度报告审计意见为无法发表意见或者证监会立案调查等公司属于财务欺诈样本年度报告审计意见为标准无保留意见和财务报表满足利润现金流量 0 的公司属于配对样本解释变量开始选择11个财务指标通过T检验确定6个指标资产负债率资产毛利率资产周转率营运资金比率应收账款周转率经营活动现金流量资产额 53 样本财务欺诈公司30 非财务欺诈公司30采用犯第一类错误最小原则确定最优阈值为0 68欺诈样本中 p0 68 25个占83 3 54 其它实例上市公司并购被解释变量当年发生并购行为为1 反之为0 解释变量净利润率全流通虚变量试图研究全流通都并购的影响样本 1994 2008上市公司并购样本731 非并购样本9835 采用先验原则 P 5 模拟结果并购样本中 p 5 占53 非并购样本中 p 5 占72 55

展开阅读全文