倾向值匹配模型 (PSM模型)

上传人:尔*** 文档编号:135596308 上传时间:2020-06-17 格式:PPT 页数:45 大小:594KB
返回 下载 相关 举报
倾向值匹配模型 (PSM模型)_第1页
第1页 / 共45页
倾向值匹配模型 (PSM模型)_第2页
第2页 / 共45页
倾向值匹配模型 (PSM模型)_第3页
第3页 / 共45页
倾向值匹配模型 (PSM模型)_第4页
第4页 / 共45页
倾向值匹配模型 (PSM模型)_第5页
第5页 / 共45页
点击查看更多>>
资源描述

《倾向值匹配模型 (PSM模型)》由会员分享,可在线阅读,更多相关《倾向值匹配模型 (PSM模型)(45页珍藏版)》请在金锄头文库上搜索。

1、 倾向值匹配法 PSM Q 为什么要使用PSM A 解决样本选择偏误带来的内生性问题例 上北大有助于提高收入吗 样本选择偏误 考上北大的孩子本身就很出色 聪明 有毅力 能力强 解决方法 样本配对 配对方法 同行业 一维配对 同行业 规模相当 二维配对 同行业 规模相当 股权结构相当 多维配对 PSM 把多个维度的信息浓缩成一个 降维 多维到一维 配对过程中的两个核心问题 1 Q1 哪个样本更好一些 A1 Sample2较好 比较容易满足共同支撑假设 commonsupportassumption 配对过程中的两个核心问题 2 Q2 stuc1 c2 c3三人中 谁是stuPK的最佳配对对象 A

2、2 stuc3是最佳配对对象 比较容易满足平行假设 balancingassumption ATT AverageTreatmentEffectontheTreated 平均处理效应的衡量 运用得分进行样本匹配并比较 估计出ATT值 ATT E Y 1 Y 0 T 1 Y 1 StuPK上北大后的年薪Y 0 StuPK假如不上北大的年薪 可观测数据 不可观测数据 采用配对者的收入来代替 ATT 12W 9W 3W 实例介绍 实例介绍 研究问题 培训对工资的效应基本思想 分析接受培训行为与不接受培训行为在工资表现上的差异 但是 现实可以观测到的是处理组接受培训的事实 而如果处理组没有接受培训会怎

3、么样是不可观测的 这种状态称为反事实 匹配法就是为了解决这种不可观测的事实的方法 实例介绍 分组 在倾向值匹配法中 根据处理指示变量将样本分为两个组 处理组 在本例中就是在NSW 国家支持工作示范项目 实施后接受培训的组 控制组 在本例中就是在NSW实施后不接受培训的组 研究目的 通过对处理组和对照组的匹配 在其他条件完全相同的情况下 通过接受培训的组 处理组 与不接受培训的组 控制组 在工资表现上的差异来判断接受培训的行为与工资之间的因果关系 变量定义 变量定义 倾向打分 OLS回归结果 工资的变化到底是来自个体的异质性性还是培训 倾向打分 1 设定宏变量 1 设定宏变量breps表示重复抽

4、样200次命令 globalbreps200 2 设定宏变量x 表示ageagesqeduceducsqmarriedblackhispre74re75re74sqre75squ74black命令 globalxageagesqeduceducsqmarriedblackhispre74re75re74sqre75squ74black 倾向打分 2 通过logit模型进行倾向打分命令 pscoretreat x pscore mypscore blockid myblock comsupnumblo 5 level 0 05 logit注 表示引用宏变量 pscore结果 倾向值分布 倾向值分

5、布 block中样本的分布 block中的描述性统计 运用得分进行样本匹配并比较 方法一 最邻近方法 nearestneighbormatching 含义 最邻近匹配法是最常用的一种匹配方法 它把控制组中找到的与处理组个体倾向得分差异最小的个体 作为自己的比较对象 优点 按处理个体找控制个体 所有处理个体都会配对成功 处理组的信息得以充分使用 缺点 由于不舍弃任何一个处理组 很可能有些配对组的倾向得分差距很大 也将其配对 导致配对质量不高 而处理效应ATT的结果中也会包含这一差距 使得ATT精确度下降 方法一 最邻近方法 nearestneighbormatching 命令setseed101

6、01 产生随机数种子 attndre78treat x comsupbootreps breps dotslogit 方法一 最邻近方法 nearestneighbormatching 方法二 半径匹配法 radiusmatching 半径匹配法是事先设定半径 找到所有设定半径范围内的单位圆中的控制样本 半径取值为正 随着半径的降低 匹配的要求越来越严 方法二 半径匹配法 radiusmatching 命令setseed10101attrre78treat x comsupbootreps breps dotslogitradius 0 001 方法二 半径匹配法 radiusmatching

7、 方法三 分层匹配法 stratificationmatching 内容 分层匹配法是根据估计的倾向得分将全部样本分块 使得每块的平均倾向得分在处理组和控制组中相等 优点 Cochrane Chambers 1965 指出五个区就可以消除95 的与协变量相关的偏差 这个方法考虑到了样本的分层问题或聚类问题 就是假定 每一层内的个体样本具有相关性 而各层之间的样本不具有相关性 缺点 如果在每个区内找不到对照个体 那么这类个体的信息 会丢弃不用 总体配对的数量减少 方法三 分层匹配法 stratificationmatching 命令setseed10101attsre78treat pscore

8、 mypscore blockid myblock comsupbootreps breps dots 方法三 分层匹配法 stratificationmatching 方法四 核匹配法 kernelmatching 核匹配是构造一个虚拟对象来匹配处理组 构造的原则是对现有的控制变量做权重平均 权重的取值与处理组 控制组PS值差距呈反向相关关系 方法四 核匹配法 kernelmatching 命令setseed10101attkre78treat x comsupbootreps breps dotslogit 方法四 核匹配法 kernelmatching psmatch2 匹配变量的筛选

9、1 设定宏变量设定宏变量x 表示ageagesqeduceducsqmarriedblackhispre74re75re74sqre75squ74black命令 globalxageagesqeduceducsqmarriedblackhispre74re75re74sqre75squ74black 匹配变量的筛选 2 初步设定logittreat x 匹配变量的筛选 3 逐步回归stepwise pr 0 1 logittreat x ps值的计算 psmatch2treat x out re78 倾向得分的含义是 在给定X的情况下 样本处理的概率值 利用logit模型估计样本处理的概率值

10、概率表示如下 P x Pr D 1 X E D X 匹配处理组 最近邻匹配命令 psmatch2treat x ifsoe 1 out re78 neighbor 2 ate半径匹配命令 psmatch2treat x out re78 ateradiuscaliper 0 01 核匹配命令 psmatch2treat x out re78 atekernel 匹配处理组 满足两个假设 A共同支撑假设B平行假设 ATT 平均处理效应的衡量 以半径匹配为例 psmatch2treat x out re78 ateradiuscaliper 0 01 1 2 3 1 处理组平均效应 ATT 2 控

11、制组平均效应 ATU 3 总体平均效应 ATE ATT 平均处理效应的衡量 匹配前后变量的差异对比命令 pstestre78 x pstestre78 x bothgraph 匹配前后密度函数图 twoway kdensity psif treat 1 legend label 1 Treat kdensity psif wei 1 wei legend label 2 Control xtitle Pscore title AfterMatching twoway kdensity psif treat 1 legend label 1 Treat kdensity psif treat 0 legend label 2 Control xtitle Pscore title BeforeMatching 运用bootstrap获得ATT标准误 命令 bootstrap reps psmatch2treat x out re78 在统计分析中 样本较少 采用bootstrap 可以减少小样本偏误 步骤 首先 从原始样本中可重复地随机抽取n个观察值 得到经验样本 然后采用PSM计算改经验样本的平均处理效果ATT 将第一步和第二步重复进行 次 得出 个ATT值 计算 个ATT值的标准差 核匹配的Bootstrap检验

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号