多元选择模型.ppt

上传人:F****n 文档编号:109353560 上传时间:2019-10-26 格式:PPT 页数:41 大小:400.50KB
返回 下载 相关 举报
多元选择模型.ppt_第1页
第1页 / 共41页
多元选择模型.ppt_第2页
第2页 / 共41页
多元选择模型.ppt_第3页
第3页 / 共41页
多元选择模型.ppt_第4页
第4页 / 共41页
多元选择模型.ppt_第5页
第5页 / 共41页
点击查看更多>>
资源描述

《多元选择模型.ppt》由会员分享,可在线阅读,更多相关《多元选择模型.ppt(41页珍藏版)》请在金锄头文库上搜索。

1、1,第十章 多元选择模型,(Multiple-choice models),2,本章内容,一、无序多元选择模型 二、有序因变量模型(Ordered data) 三、计数模型(Count data),3,一、基本概念,对于多元选择模型,可以根据因变量的性质分为有序选择模型和无序选择模型两种类型。 (一)无序模型:因变量Y表示观察对象的类型归属。 例1:交通问题(走路、骑自行车、乘公共汽车、打出租 车、开私家车) 例2:就业问题:农民工就业行业选择;农村劳动力转移 (小城镇、县级市、地级市、 省级城市、大城、) 例3:农户借贷(国有银行、信用社、民间借贷) 例4:超市购物选择 例5:农户土地流转(

2、转包、出租、互换、转让、股份合 作),4,(二)有序模型:观察到的因变量Y表示出按数值大小(ordered)或重要性 (ranked)排序的分类结果: 例1:个人达到的教育水平分文盲、小学、初中、高中、 大学、研究生等 例2:考试成绩分优秀、良好、及格和不及格等;学生奖 学金等级; 例3:评价意见调查分非常不满意、不满意、一般、满意、 非常满意等 例4:住房选择:租房、小户型、大户型、别墅 例5:银行信誉等级,5,二、无序多元选择模型,无序的Probit计算复杂,故考虑有三种选择的Logit模型 即每个方程都假定,任两个选择的机会比对数是特征X的线性函数。 由于所有概率之和等于1,因而机会比相

3、互依赖,上述限制使需要估计的参数由6个减少到4个。,6,对于无序选择模型,其行为选择假定出于优化一个随机效用函数。 考虑第i个消费者面临着k种选择,假定选择j的效用为: 如果消费者选择了j,那么我们假定消费者由这一选择获得的效用高于其他选择。 考虑效用比较的概率函数 就误差分布形式做出假定后得到可以估计的选择行为模型。,7,无序多元选择模型,产生系数限制的原因: 这意味着以下限制条件: 即只需要估计系统中的两个方程便可以得到所有参数。,8,无序多元选择模型,如果样本属于重复试验,那么可以计算出与每个组相联系的概率rij/ni,然后计算出机会比的对数,与X做回归。 式中rij表示组i中选择j的次

4、数占该组观察对象总数ni的比例 如果没有足够多的重复,则需要利用最大似然法进行估计。,9,举例,用多元Logit模型分析农户合作医疗方式选择 数据:6个省的2505个农户的问卷调查,有951户做出了选择。分析只利用此子样本。 合作医疗方式分为三类 福利型:每人年交5-10元,减免挂号、诊断、注射、处理费; 福利风险型:每人年交20-100元,报销大病和小病的部分医疗费用; 风险型:每人年交20-50元,报销大病的部分医疗费用。,10,11,12,二、有序因变量模型,同二元选择模型一样,我们可以考虑隐变量y*的值取决于一组自变量X,即: 观察到的Y由Y*决定,即如果连续性随机变量Y*超过某个临界

5、值 ,则对应Y的一个确定性选择。两者的关系是: 需要注意的是,反映类型差异的数字是任意的,但必须保证当 有序因变量模型也有probit、logit 、extreme value三种形式可供选择,用极大似然法(ML)进行参数估计。 事先也不确定,需要与一起作为参数进行估计。,有序因变量模型,假设残差项u服从标准正态分布或logit分布,则可得排序选择模型的概率形式。每个Y的概率为: 式中F为残差项的累积分布函数。,在有序因变量模型中,因变量的值仅仅反映排序,因而对其数值及间隔并无特殊要求。 例:序列(1,2,3,4)等同于序列(1,10,30,100) 因变量必须是整数,可以利用EVIEWS的函

6、数功能做转换(Round, Floor, Ceil),14,有序因变量模型,参数估计:分类临界值和参数 估计方法:极大似然法 极大似然函数: 式中函数I(.)是一个指标函数,当括号中的逻辑关系为真时等于1,反之等于0。 为了保证概率为正值,所有的必须满足 0 1 2 M 。,15,有序Probit模型的概率,0,0.1,0.2,0.3,0.4,Y=0,Y=1,Y=2,Y=3,Y=4,16,选择一种估计方法(Probit, Logit, Extreme value) 确定估计模型所使用的样本区间 按OK后EVIEWS利用迭代求解法得出估计结果,包括各自变量的参数及相应的统计值,各临界点和其统计值

7、,其他统计检验指标等。 若模型收敛,那么报告的内容具有意义。 需要注意的问题有: 由于EVIEWS有估计参数数量限制,因而因变量的取值不能太多(使用大样本时需要特别注意)。 若某一类别中的观察值过少,此时会造成识别困难。在可能的情况下,应考虑将其合并到其他类别。,估计该方程时的步骤为: 选择QuickEstimate equation 在随后出现的对话窗口中,先选择模型设定窗口,给出Y和X(不需要截距项:,17,有序因变量模型不能用于预测因变量数值的大小,但可以用于预测属于每个类别的可能性; 选择Procs/Make model EVIEWS打开一个文件,其中包括由每个类别的概率函数组成的方程

8、组。 打OK后,EVIEWS计算出每个观察值落入任一类别的可能性,并将其储存在与因变量同名但附加上类别识别码和模拟方案(Scenario)码的变量下。,18,举例:有序因变量模型估计 某政策出台后对居民收入有影响,由此对市民的政策支持情况进行调查。通过调查取得了市民收入(X)、支持与否(Y)的数据,其中如果选民支持则 Yi 取0,中立取1,不支持取2。获得了24组数据,进行排序选择模型估计分析。,1模型的估计,待估计的三元选择模型:,待估计的潜回归模型:,待估计参数:,注意: (1)估计式中列出或者不列出无常数项是等价的。 (2)EViews要求因变量Y是整数,否则将会出现错误信息,并且估计将

9、会停止。然而,由于我们能够在表达式中使用 round、floor 或 ceil函数自动将一个非整数序列转化成整数序列,因此这并不是一个很严格的限制。,与二元选择模型类似,执行命令: Proc/make equation/, 在Equation Specification对话框中选择估计方法ORDERED,然后选择Normal,Logit,Extreme Value三种误差分布中的一种,单击OK按钮即可。,21,排序模型的输入对话框,22,2、估计结果 估计收敛后,EViews将会在方程窗口显示估计结果。表头包含通常的标题信息,包括假定的误差分布、估计样本、迭代和收敛信息、Y的排序选择值的个数和

10、计算系数协方差矩阵的方法。在标题信息之下是系数估计和渐近的标准误差、相应的z-统计量及概率值。然后,还给出了临界值LIMIT_1:C(2),LIMIT_2:C(3)的估计及相应的统计量。,23,24,4、预测 因为排序选择模型的因变量代表种类或等级数据,所以不能从估计排序模型中直接预测。 选择Procs/ Make Model,打开一个包含方程系统的没有标题的模型窗口,单击模型窗口方程栏的Solve按钮。例中因变量y*的拟合线性指标,拟和值落在第一类中的拟合概率被命名为Y_0_0的序列,落在第二类中的拟合概率命名为Y_1_0的序列中,落在第三类中的拟合概率命名为Y_2_0的序列中,等等。注意对

11、每一个观察值,落在每个种类中的拟合概率相加值为1。Y_0_0,Y_1_0,Y_2_0分别是支持、中立、不支持的概率,Y,INC是实际样本。,Procs “ Make MODEL”,按“solve”,可得潜回归模型为:,注意:因为对政府支持等级与叙述成反方向变化,即序数越大,支持度越低;序数越小,支持度越高。支持态度的分布:,或:态度Y的分布列:,30,3. 常用的两个过程 Make Ordered Limit Vector产生一个临界值向量c,此向量被命名为LIMITS01,如果该名称已被使用,则命名为LIMITS02,以此类推。 Make Ordered Limit Covariance M

12、atrix产生临界值向量c的估计值的协方差矩阵。命名为VLIMITS01,如果该名称已被使用,则命名为VLIMITS02,以此类推。,31,4产生残差序列 选择Proc/Make Residual Series产生广义残差序列,输入一个名字或用默认的名字,然后单击OK按钮。一个排序模型的广义残差由下式给出: 其中:c0 = - ,cM+1 = 。,32,三、计数模型,在计数模型中,因变量为某事件发生的次数。 例1:学生在校期间取得优秀成绩的课程数 例2:年内农户家庭外出就业的劳动力数 例3:家庭生育的小孩数 计数模型虽然可以使用最小二乘法估计,但由于因变量存在下限0,并且其取值为离散的,因而能

13、够考虑这些特点的估计方法有助于改善估计结果。 实践中Poisson回归模型应用较为广泛。 Poisson模型的弱点是误差分布的均值等于方差。,33,计数模型,Poisson回归模型假定观察值Yi来自于由某个Poisson分布抽取的样本,该分布的参数为i,其数值取决于解释变量xi。 模型形式为: 通常将i表示为对数线性函数形式: 根据Poisson,每个时期事件发生次数的期望值为: 因而有:,计数模型,Poisson回归模型是一个参数非线性模型,可以用NLS方法估计; 但用ML方法估计也非常简便,似然函数为 若我们认为Poisson回归模型关于均值与方差相等的约束不合理,那么应选择其他统计分布。

14、,34,举例:计数模型估计 研究轮船发生事故的次数与轮船的特征属性、运行时间之间的关系。因变量 y 表示平均每月轮船发生事故数。解释变量是轮船特征属性,包括轮船类型、建造时间、使用时期等。轮船类型有5种,分别用x1x5表示,4个建造时间,分别用y1y4表示,z1、z2表示两个使用时期,da表示运行时间。 本例数据符合计数模型的条件,故采用泊松模型建模。注意到定性数据较多,为防止多重共线性,在引进虚拟变量时,需要人为地去掉一个。例如,轮船类型有5种x1x5,去掉x1,在模型中只用其余4个变量x2x5;同样, 4个建造时间y1y4,在模型中只用其余3个变量y2y4;两个使用时期在模型中只用z2。模

15、型如下:,36,1. 计数模型估计: 选择Quick Estimate equation Count 在随后出现的窗口中给出模型设定、估计方法选择、样本区间和其他选项。 按OK后得到估计结果。 基于不同误差分布,EViews提供了5种计数模型估计方法: PoissonML and QML; ExponentialQML; Normal/NLSQML; Negative binomialML; Negative binomialQML。 从上面的5种计数模型中选择一种,并且对于Negative binomialQML模型需要指定一个值作为固定的方差参数。前4种方法对应4种因变量的分布,分别为泊松

16、分布、负二项分布、指数分布和正态分布。,37,计数模型的估计对话框,39,写成方程如下: z =(-6.41) (-1.29) (-2.26) (-0.46) (1.13) (4.31) (4.28) (1.5) (3.13) (8.87) 轮船类型对事故发生有影响,如类型是x5的系数是正的,会使事故发生的可能增加;建造时间y2y4的系数基本是递减的,表明建造时间越长,则发生事故的可能越大;使用时期z2也对事故发生产生很大影响,使用时间越长,则发生事故的可能越大;运行时间ln(da) 的系数是0.9,表明运行时间每增加1%,则发生事故数量会增加0.9%,因此对发生事故有显著的影响。,2. 模型的预测与产生残差 选择Forecast可以预测因变量 和线性指标(xb),b是参数 的估计值,二者的关系为 = exp(xb)。选择Proc/Make Re

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 幼儿/小学教育 > 小学教育

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号