二元离散选择模型PPT幻灯片课件

上传人:日度 文档编号:134597709 上传时间:2020-06-07 格式:PPT 页数:55 大小:913KB
返回 下载 相关 举报
二元离散选择模型PPT幻灯片课件_第1页
第1页 / 共55页
二元离散选择模型PPT幻灯片课件_第2页
第2页 / 共55页
二元离散选择模型PPT幻灯片课件_第3页
第3页 / 共55页
二元离散选择模型PPT幻灯片课件_第4页
第4页 / 共55页
二元离散选择模型PPT幻灯片课件_第5页
第5页 / 共55页
点击查看更多>>
资源描述

《二元离散选择模型PPT幻灯片课件》由会员分享,可在线阅读,更多相关《二元离散选择模型PPT幻灯片课件(55页珍藏版)》请在金锄头文库上搜索。

1、第2节离散被解释变量计量经济学模型 二元选择模型ModelswithDiscreteDependentVariables BinaryChoiceModel 一 社会经济生活中的二元选择问题二 二元离散选择模型三 二元Probit离散选择模型及其参数估计四 二元Logit离散选择模型及其参数估计五 二元离散选择模型的检验 1 说明 离散被解释变量数据计量经济学模型 ModelswithDiscreteDependentVariables 和离散选择模型 DCM DiscreteChoiceModel 的区别 二元选择模型 BinaryChoiceModel 和多元选择模型 MultipleCh

2、oiceModel 本节只介绍二元选择模型 2 离散选择模型起源于Fechner于1860年进行的动物条件二元反射研究 1962年 Warner首次将它应用于经济研究领域 用以研究公共交通工具和私人交通工具的选择问题 70 80年代 离散选择模型被普遍应用于经济布局 企业定点 交通问题 就业问题 购买决策等经济决策领域的研究 模型的估计方法主要发展于80年代初期 3 一 社会经济生活中的二元选择问题 4 研究选择结果与影响因素之间的关系 选择结果 0 1影响选择结果的因素包括两部分 决策者的属性和备选方案的属性 5 两种方案的选择由决策者的属性和备选方案的属性共同决定 例如 选择利用公共交通工

3、具还是私人交通工具 取决于两类因素 一类是公共交通工具和私人交通工具所具有的属性 诸如速度 耗费时间 成本等 一类是决策个体所具有的属性 诸如职业 年龄 收入水平 健康状况等 从大量的统计中 可以发现选择结果与影响因素之间具有一定的因果关系 6 单个方案的取舍一般由决策者的属性决定 例如 对某种商品的购买决策问题 决定购买与否 取决于两类因素 一类是该商品本身所具有的属性 诸如性能 价格等 一类是消费者个体所具有的属性 诸如收入水平 对该商品的偏好程度等 对于所有的决策者 商品本身所具有的属性是相同的 在模型中一般不予体现 7 二 二元离散选择模型 8 1 原始模型 对于二元选择问题 可以建立

4、如下计量经济学模型 其中Y为观测值为1和0的决策被解释变量 X为解释变量 包括选择对象所具有的属性和选择主体所具有的属性 左右端矛盾 9 由于存在这两方面的问题 主要是模型左右端矛盾问题 导致 原始模型不能作为实际研究二元选择问题的模型 需要将原始模型变换为效用模型 一般教科书称为潜变量模型 LatentVariableModel 这是离散选择模型的关键 具有异方差性 10 2 效用模型 作为研究对象的二元选择模型 第i个个体选择1的效用 第i个个体选择0的效用 11 注意 在效应模型中 被解释变量是不可观测的潜变量 人们能够得到的观测值仍然是选择结果 即1和0 很显然 如果不可观测的U1 U

5、0 即对应于观测值为1 因为该个体选择公共交通工具的效用大于选择私人交通工具的效用 他当然要选择公共交通工具 相反 如果不可观测的U1 U0 即对应于观测值为0 因为该个体选择公共交通工具的效用小于选择私人交通工具的效用 他当然要选择私人交通工具 OLS不能用于效用模型的估计 12 3 最大似然估计 欲使得效用模型可以采用ML估计 就必须为随机误差项选择一种特定的概率分布 两种最常用的分布是标准正态分布和逻辑 logistic 分布 于是形成了两种最常用的二元选择模型 Probit模型和Logit模型 最大似然函数及其估计过程如下 13 标准正态分布或逻辑分布的对称性 似然函数 14 在样本数

6、据的支持下 如果知道概率分布函数和概率密度函数 求解该方程组 可以得到模型参数估计量 1阶极值条件 15 三 二元Probit离散选择模型及其参数估计 16 1 标准正态分布的概率分布函数 17 2 重复观测值不可以得到情况下二元Probit离散选择模型的参数估计 18 关于参数的非线性函数 不能直接求解 需采用完全信息最大似然法中所采用的迭代方法 应用计量经济学软件 这里所谓 重复观测值不可以得到 是指对每个决策者只有一个观测值 如果有多个观测值 也将其看成为多个不同的决策者 19 3 例题 贷款决策模型 分析与建模 某商业银行从历史贷款客户中随机抽取78个样本 根据设计的指标体系分别计算它

7、们的 商业信用支持度 XY 和 市场竞争地位等级 SC 对它们贷款的结果 JG 采用二元离散变量 1表示贷款成功 0表示贷款失败 目的是研究JG与XY SC之间的关系 并为正确贷款决策提供支持 20 样本观测值 21 选择Probit模型 22 估计结果 23 输出的估计结果 该方程表示 当XY和SC已知时 代入方程 可以计算贷款成功的概率JGF 例如 将表中第19个样本观测值XY 15 SC 1代入方程右边 计算括号内的值为0 1326552 查标准正态分布表 对应于0 1326552的累积正态分布为0 5517 于是 JG的预测值JGF 1 0 5517 0 4483 即对应于该客户 贷款

8、成功的概率为0 4483 24 正确解读该结果十分重要讨论 能否说 当市场竞争地位等级提高1 给该企业贷款成功的概率提高5 062 不能 为什么 能否说 对于不同的企业 当市场竞争地位等级都提高1 给这些企业贷款成功的概率所提高的幅度是相同的 不能 为什么 25 模拟预测 26 预测 如果有一个新客户 根据客户资料 计算的 商业信用支持度 XY 和 市场竞争地位等级 SC 代入模型 就可以得到贷款成功的概率 以此决定是否给予贷款 27 4 重复观测值可以得到情况下二元Probit离散选择模型的参数估计 思路对每个决策者有多个重复 例如10次左右 观测值 对第i个决策者重复观测ni次 选择yi

9、1的次数比例为pi 那么可以将pi作为真实概率Pi的一个估计量 建立 概率单位模型 采用广义最小二乘法估计 实际中并不常用 28 对第i个决策者重复观测n次 选择yi 1的次数比例为pi 那么可以将pi作为真实概率Pi的一个估计量 定义 观测到的 概率单位 29 V的观测值通过求解标准正态分布的概率分布函数的反函数得到 实际观测得到的 30 四 二元Logit离散选择模型及其参数估计 31 1 逻辑分布的概率分布函数 32 2 重复观测值不可以得到情况下二元logit离散选择模型的参数估计 关于参数的非线性函数 不能直接求解 需采用完全信息最大似然法中所采用的迭代方法 应用计量经济学软件 33

10、 34 35 36 37 3 重复观测值可以得到情况下二元logit离散选择模型的参数估计 思路对每个决策者有多个重复 例如10次左右 观测值 对第i个决策者重复观测ni次 选择yi 1的次数比例为pi 那么可以将pi作为真实概率Pi的一个估计量 建立 对数成败比例模型 采用广义最小二乘法估计 实际中并不常用 38 用样本重复观测得到的pi构成 成败比例 取对数并进行台劳展开 有 逻辑分布的概率分布函数 39 五 二元离散选择模型的检验 40 1 拟合检验 P 样本观测值中被解释变量等于1的比例 L0 模型中所有解释变量的系数都为0时的似然函数值 LRI 1 即L 1 完全拟合 LRI 0 所

11、有解释变量完全不显著 完全不拟合 41 LnL 1 639954LnL0 52 80224LRI 0 968942 42 2 总体显著性检验 例中 lnL 1 639954 lnL0 52 80224 LR 102 3246 20 01 2 9 21 可见 在0 01的显著水平上 该模型拒绝总体不显著的0假设 43 3 异方差性检验 截面数据样本 容易存在异方差性 假定异方差结构为 采用LM检验 将解释变量分为两类 Z为只与个体特征有关的变量 显然异方差与这些变量相关 将异方差检验问题变为一个约束检验问题 44 由于一般都存在异方差 不检验 直接采用White修正进行估计 45 46 4 分布

12、检验 检验关于分布的假设 probit logit 一般不进行该项检验 具体见相关教科书 Greene P682 47 模型1的参数 模型2的参数 组合模型的似然函数 构造LM统计量 如果不拒绝0假设 表明模型1是适当的 48 5 回代检验 概率阈值朴素选择 p 0 5 1 0的样本相当时 先验选择 p 选1的样本数 全部样本 全样本时 最优阈值 犯第一类错误最小原则 49 如果按照朴素原则 例中 除了2个样本外 所有样本都通过了回代检验 没有通过回代检验的2个样本中 第19个样本的选择结果为1 回代算得的选择1的概率为0 4472 第45个样本的选择结果为0 回代算得的选择1的概率0 549

13、8 但是 该例中 选择1和选择0的样本数目分别为32和46 差异较大 不适合采用该方法 50 如果按照先验方法 即以全部样本中选择1的样本所占的比例为临界值 例中 选择1的样本的比例为0 41 以此为临界值 只有第45个样本不能通过检验 但是 该方法适合于以全部个体作为样本的情况 而该例中的78个样本仅是贷款客户的极少部分 所以也不适合采用该方法 51 如果按照最优方法 即以 犯第一类错误最小 为原则确定临界值的方法 在例中 如果以0 50为临界值 则有2个样本发生 弃真 即犯第一类错误 如果以0 41为临界值 则发生 弃真 的样本只有1个 所以以0 41作为临界值比较合适 52 其它实例 财

14、务欺诈识别模型建立我国上市公司财务欺诈识别模型样本 年度报告审计意见为 无法发表意见 或者 证监会立案调查 等公司属于财务欺诈样本 年度报告审计意见为 标准无保留意见 和财务报表满足 利润 现金流量 0 的公司属于配对样本 解释变量 开始选择11个财务指标 通过T检验 确定6个指标 资产负债率 资产毛利率 资产周转率 营运资金比率 应收账款周转率 经营活动现金流量 资产额 53 样本 财务欺诈公司30 非财务欺诈公司30采用犯第一类错误最小原则确定最优阈值为0 68欺诈样本中 p0 68 25个 占83 3 54 其它实例 上市公司并购被解释变量 当年发生并购行为为1 反之为0 解释变量 净利润率 全流通虚变量 试图研究全流通都并购的影响 样本 1994 2008上市公司 并购样本731 非并购样本9835 采用先验原则 P 5 模拟结果 并购样本中 p 5 占53 非并购样本中 p 5 占72 55

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 营销创新

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号