倾向值匹配模型 (PSM模型)

资源描述

《倾向值匹配模型 (PSM模型)》由会员分享，可在线阅读，更多相关《倾向值匹配模型 (PSM模型)（45页珍藏版）》请在金锄头文库上搜索。

1、倾向值匹配法 PSM Q 为什么要使用PSM A 解决样本选择偏误带来的内生性问题例上北大有助于提高收入吗样本选择偏误考上北大的孩子本身就很出色聪明有毅力能力强解决方法样本配对配对方法同行业一维配对同行业规模相当二维配对同行业规模相当股权结构相当多维配对 PSM 把多个维度的信息浓缩成一个降维多维到一维配对过程中的两个核心问题 1 Q1 哪个样本更好一些 A1 Sample2较好比较容易满足共同支撑假设 commonsupportassumption 配对过程中的两个核心问题 2 Q2 stuc1 c2 c3三人中谁是stuPK的最佳配对对象 A

2、2 stuc3是最佳配对对象比较容易满足平行假设 balancingassumption ATT AverageTreatmentEffectontheTreated 平均处理效应的衡量运用得分进行样本匹配并比较估计出ATT值 ATT E Y 1 Y 0 T 1 Y 1 StuPK上北大后的年薪Y 0 StuPK假如不上北大的年薪可观测数据不可观测数据采用配对者的收入来代替 ATT 12W 9W 3W 实例介绍实例介绍研究问题培训对工资的效应基本思想分析接受培训行为与不接受培训行为在工资表现上的差异但是现实可以观测到的是处理组接受培训的事实而如果处理组没有接受培训会怎

3、么样是不可观测的这种状态称为反事实匹配法就是为了解决这种不可观测的事实的方法实例介绍分组在倾向值匹配法中根据处理指示变量将样本分为两个组处理组在本例中就是在NSW 国家支持工作示范项目实施后接受培训的组控制组在本例中就是在NSW实施后不接受培训的组研究目的通过对处理组和对照组的匹配在其他条件完全相同的情况下通过接受培训的组处理组与不接受培训的组控制组在工资表现上的差异来判断接受培训的行为与工资之间的因果关系变量定义变量定义倾向打分 OLS回归结果工资的变化到底是来自个体的异质性性还是培训倾向打分 1 设定宏变量 1 设定宏变量breps表示重复抽

4、样200次命令 globalbreps200 2 设定宏变量x 表示ageagesqeduceducsqmarriedblackhispre74re75re74sqre75squ74black命令 globalxageagesqeduceducsqmarriedblackhispre74re75re74sqre75squ74black 倾向打分 2 通过logit模型进行倾向打分命令 pscoretreat x pscore mypscore blockid myblock comsupnumblo 5 level 0 05 logit注表示引用宏变量 pscore结果倾向值分布倾向值分

5、布 block中样本的分布 block中的描述性统计运用得分进行样本匹配并比较方法一最邻近方法 nearestneighbormatching 含义最邻近匹配法是最常用的一种匹配方法它把控制组中找到的与处理组个体倾向得分差异最小的个体作为自己的比较对象优点按处理个体找控制个体所有处理个体都会配对成功处理组的信息得以充分使用缺点由于不舍弃任何一个处理组很可能有些配对组的倾向得分差距很大也将其配对导致配对质量不高而处理效应ATT的结果中也会包含这一差距使得ATT精确度下降方法一最邻近方法 nearestneighbormatching 命令setseed101

6、01 产生随机数种子 attndre78treat x comsupbootreps breps dotslogit 方法一最邻近方法 nearestneighbormatching 方法二半径匹配法 radiusmatching 半径匹配法是事先设定半径找到所有设定半径范围内的单位圆中的控制样本半径取值为正随着半径的降低匹配的要求越来越严方法二半径匹配法 radiusmatching 命令setseed10101attrre78treat x comsupbootreps breps dotslogitradius 0 001 方法二半径匹配法 radiusmatching

7、方法三分层匹配法 stratificationmatching 内容分层匹配法是根据估计的倾向得分将全部样本分块使得每块的平均倾向得分在处理组和控制组中相等优点 Cochrane Chambers 1965 指出五个区就可以消除95 的与协变量相关的偏差这个方法考虑到了样本的分层问题或聚类问题就是假定每一层内的个体样本具有相关性而各层之间的样本不具有相关性缺点如果在每个区内找不到对照个体那么这类个体的信息会丢弃不用总体配对的数量减少方法三分层匹配法 stratificationmatching 命令setseed10101attsre78treat pscore

8、 mypscore blockid myblock comsupbootreps breps dots 方法三分层匹配法 stratificationmatching 方法四核匹配法 kernelmatching 核匹配是构造一个虚拟对象来匹配处理组构造的原则是对现有的控制变量做权重平均权重的取值与处理组控制组PS值差距呈反向相关关系方法四核匹配法 kernelmatching 命令setseed10101attkre78treat x comsupbootreps breps dotslogit 方法四核匹配法 kernelmatching psmatch2 匹配变量的筛选

9、1 设定宏变量设定宏变量x 表示ageagesqeduceducsqmarriedblackhispre74re75re74sqre75squ74black命令 globalxageagesqeduceducsqmarriedblackhispre74re75re74sqre75squ74black 匹配变量的筛选 2 初步设定logittreat x 匹配变量的筛选 3 逐步回归stepwise pr 0 1 logittreat x ps值的计算 psmatch2treat x out re78 倾向得分的含义是在给定X的情况下样本处理的概率值利用logit模型估计样本处理的概率值

10、概率表示如下 P x Pr D 1 X E D X 匹配处理组最近邻匹配命令 psmatch2treat x ifsoe 1 out re78 neighbor 2 ate半径匹配命令 psmatch2treat x out re78 ateradiuscaliper 0 01 核匹配命令 psmatch2treat x out re78 atekernel 匹配处理组满足两个假设 A共同支撑假设B平行假设 ATT 平均处理效应的衡量以半径匹配为例 psmatch2treat x out re78 ateradiuscaliper 0 01 1 2 3 1 处理组平均效应 ATT 2 控

11、制组平均效应 ATU 3 总体平均效应 ATE ATT 平均处理效应的衡量匹配前后变量的差异对比命令 pstestre78 x pstestre78 x bothgraph 匹配前后密度函数图 twoway kdensity psif treat 1 legend label 1 Treat kdensity psif wei 1 wei legend label 2 Control xtitle Pscore title AfterMatching twoway kdensity psif treat 1 legend label 1 Treat kdensity psif treat 0 legend label 2 Control xtitle Pscore title BeforeMatching 运用bootstrap获得ATT标准误命令 bootstrap reps psmatch2treat x out re78 在统计分析中样本较少采用bootstrap 可以减少小样本偏误步骤首先从原始样本中可重复地随机抽取n个观察值得到经验样本然后采用PSM计算改经验样本的平均处理效果ATT 将第一步和第二步重复进行次得出个ATT值计算个ATT值的标准差核匹配的Bootstrap检验

展开阅读全文