经济学实证研究中的40个常见误区ppt课件.pptx

上传人:资****亨 文档编号:124580367 上传时间:2020-03-12 格式:PPTX 页数:60 大小:3.57MB
返回 下载 相关 举报
经济学实证研究中的40个常见误区ppt课件.pptx_第1页
第1页 / 共60页
经济学实证研究中的40个常见误区ppt课件.pptx_第2页
第2页 / 共60页
经济学实证研究中的40个常见误区ppt课件.pptx_第3页
第3页 / 共60页
经济学实证研究中的40个常见误区ppt课件.pptx_第4页
第4页 / 共60页
经济学实证研究中的40个常见误区ppt课件.pptx_第5页
第5页 / 共60页
点击查看更多>>
资源描述

《经济学实证研究中的40个常见误区ppt课件.pptx》由会员分享,可在线阅读,更多相关《经济学实证研究中的40个常见误区ppt课件.pptx(60页珍藏版)》请在金锄头文库上搜索。

1、踩雷了 经济学实证研究的40个常见误区 1 40个误区 我 初学时 投稿时踩雷 作为审稿人 见过别人踩雷 作为老师 见过学生踩雷 2 实证研究的六个步骤 共40个误区 Idea 4 Data 5 Identification 19 Stata 4 Writing 5 Submission 3 3 治学问若烹小鲜 4 治学问若烹小鲜 菜谱 Idea Taste 食材 Data 锅 Stata Computer 火候 Identification 装盘 Writing 上菜 Submission 5 菜谱 IDEA 的四个误区 误区1 不学理论 误区2 取法于下 误区3 广 与 专 的关系没处理好

2、 误区4 操之过急 6 IDEA TASTE的四大来源 现实 理论 文献 数据 识别 7 误区1 不学理论 三高过后 长舒一口气 为什么理论重要 Taste 理论的高度决定实证的高度 例 新农保对居民消费的影响 例 省管县改革对经济增长的影响 Mechanism 讲清楚机制 需要理论 Publication 同时有理论和实证的论文好发 结 构式估计 成为理论与实证俱佳的人才 很难 8 实证研究的核心使命是什么 检验理论是否成立 如果不成立 是因为什么假设条件 多种理论同时存在 哪一个成立 激发新的理论 9 实证是灰色的 唯有理论之树长青 理论物理 VS 实验物理 杨振宁 李振道 宇称不守恒 吴

3、健雄 吴健雄细心爱护与训练电子 要把电子训练 得好 晶体里面没杂质 才能从它们的行为中 得到数据 告诉你现实的世界是怎么回事 10 怎样学理论 学好教科书 不一定是学术模型 熟练掌握领域内的经典理论 泛读领域内前沿理论文献 计量经济学理论也很重要 11 误区2 取法于下 不要读太多D类杂志 不然Taste变差 对计 量要求也变低 甚至写作也变差 古人云 取法于上 仅得为中 取法于中 故为其下 取法于下 则无所得矣 期刊list 12 误区3 广 与 专 的关系没处理好 Development economics 宏观 劳动 制度 政治 区域 城市 产业 公 共 经济史 一个对话引起的讨论 普通

4、人精力有限 不是Daron Acemoglu 广泛训练 专业研究 13 误区4 操之过急 想到idea 要多思考一段时间 科研考核制度 每个研究者电脑里都有一长串to do list 有很多半 成品 思考时间足够长后 再去读文献 某一线女演员 停工一年 只因没有好剧本 我宁可他们暂时把我忘了 我也不愿意他们看 着一个烂戏想起我来 14 食材 数据的五个误区 误区5 样本不够大 误区6 样本不够长 误区7 用国外数据 误区8 不熟悉数据库 误区9 不描述数据 15 误区5 样本不够大 很多同学用分省数据 时序数据 为什么样本大了好 a大数定律 样本不够大 发现不了规律 即使碰巧发现了规律 sta

5、ndard error会大 导致统计显著性不过关 b微观数据 可以把机制做清楚 c有足够多的花样做异质性 d没有功劳 也有苦劳 16 变量的显著性检验 的标准误如下 17 数大便是美 徐志摩 志摩日记二则 数大便是美 碧绿的山坡前几千只绵羊 挨成一片的雪绒 是美 一天的繁星 千万只闪亮的神眼 从无极的蓝空中下窥大地 是美 泰山顶上的云海 巨万的云峰在晨光里静定着 是美 大海万顷的波浪 戴著各式的白帽 在日光里动荡着 是美 爱尔兰附近的那个羽毛岛上栖息着几千万的飞禽 夕阳西沉时只见 一个羽化的大空 只是万鸟齐鸣的大声 是美 数大便是美 数大了似乎按照著一种自然规律 自然也会有一种特别的排列 一

6、种特别的节奏 一种特殊的式样 激动我们审美的本能 激发我们审 美的情绪 18 误区5 样本不够大 如果你的研究问题有更细的数据 就不要用粗的 数据 分省VS分市VS微观 例 金融发展对经济增长的影响 例 新农保对消费的影响 我们的幸运 大国 大数据的时代 例外 Acemoglu AER The Colonial Origins of Comparative Development 只有63个观测值 这很运气 稍微碰一下 显著性就没了 19 误区6 样本不够长 面板数据的样本要尽量长 长了才能体现出效果 例 省管县改革2004年 只用2002 2005年数 据 20 误区7 慎用国外数据 你不了

7、解国外的月亮 熟悉制度背景是很难的 遑论找到exogeneous shock 当然 国外文献还是要读 是要有比较的眼光 美国著名政治学家和社会学家李普塞特 只懂得 一个国家的人 他实际上什么国家都不懂 欧美的发展经济学家 例外 金融学 要用美国数据 21 误区8 不熟悉数据库 没有变量 巧妇难为无米之炊 没有变量 你 甚至想不到idea 花时间读问卷 了解数据库里有哪些变量 了 解统计年鉴 吃透数据库 不要打一枪换一个地方 青年同学们可以参加一两次调查 可以将所有 家户问卷对着自己问一遍 我自己参加过北京大学CHARLS调查 22 误区9 不描述数据 为什么要描述数据 例 省管县 a发现潜在的

8、错误 极端值 b发现变量缺失值 c最重要 知道x和y的variation来自哪里 知 道内生性 外生性 启发identification strategy d展示x和y的相关性 配合图 e配合background f告诉读者数据处理过程 如何获得回归所用样本 先仔细描述数据 再跑回归 将数据印在脑子 里去 最重要的信息写在文章当中去 23 误区9 不描述数据 如何描述 Summary x summary x detail bysort year sum x tabstat x by year codebook x corr x y twoway 24 锅 STATA的四个误区 误区10 Sta

9、ta手册式学习 忌纸上谈兵 误区11 不去研究help file 常用google bing reghdfe 误区12 不写do file do file是为了后续的修改 误区13 do file不够细致 找好的模板学习 仅保留原始数据和do file 中间过程可不要 25 火候 IDENTIFICATION的19个误区 误区14 不重视识别 误区15 不重视稳健性检验 误区16 依靠PSM和GMM解决内生性 误区17 迷信R square 误区18 控制变量选取不当 误区19 标准误不cluster 误区20 只看统计显著性 不看经济显著 性 误区21 交互项的误区 26 火候 IDENTI

10、FICATION的19误区 误区22 指标选取随意 误区23 不细究x的variation 误区24 用错虚拟变量 误区25 面板数据的误区 误区26 probit模型的误区 误区27 工具变量的误区 误区28 DID的误区 误区29 RD的误区 误区30 PSM的误区 误区31 GMM的误区 误区32 做不出结果就放弃 27 误区14 不重视识别 What are the three most important things for empirical work Identification Identification Identification John H Cochrane 200

11、5 识别的核心是 解决内生性问题 识别好 发得好 即使解决不完美 也应承认自己的x有内生性 问题 不要遮遮掩掩 选题之初 就应考虑如何解决内生性问题 Identification导向的实证研究 28 误区15 不重视稳健性检验 Robustness check 把审稿人能想到的都想到 变换x指标 变换y指标 增减控制变量 变换样本 变换估计方法 交互项 分样本 展示异质性 Placebo test placebo period group 验证机制 排除alternative hypothesis QJE的文章长 稳健性检验增加实证结果的可信度 29 实证文章 报告约50个回归 但 是跑了不少

12、于1000个 我的前半生 唐晶 熬了数个通宵给客户计 算出的评估结果 被贺 涵提高了3 个点 她 认为这是不符合客观条 件的数据 贺涵 你应该以你多 年所学的各种方法 计 算出一个人家想要的数 据结论 数据是死的 拿数据怎么排列组合 得出结论 这是活的 30 误区16 完全靠PSM和GMM解决内生性 OLS PSM GMM DID IV RDD 31 误区17 迷信R SQUARE R square的大小 在微观计量论文里通常不 用理会 但R square的大小 并不是毫无作用 增加一个x 看R sqaure的变化 Probit模型 报告persudo R square 32 误区18 控制变

13、量选取不当 Under control 遗漏变量 Over control 过度控制 例1 研究教育对收入的影响 控制男女性别 控制职业 例2 省管县对GDP增长的影响 控制财政自 主度 产业结构 城市化率 对外开放 控制了 系数就有不同的解读 实践中 可以逐步增加控制变量 作为稳健性 检验 33 误区19 标准误不CLUSTER 随机扰动项 i i d Robust error term 存在异方差 但是仍然 独立 Cluster error term 不是独立的 而是相关 的 如果不cluster的话 会导致标准误有偏 通常高估了显著性 34 误区19 标准误不CLUSTER 到底clus

14、ter在哪一层级 1 横截面数据 一般是cluster在一个更高的地域 范围内 多高呢 Tradeoff 2 cluster的数目太少 怎么办 一般应大于42 3 可以多报几种cluster的方式 表明稳健性 4 面板数据 至少应控制在个体层面 例省管县 5 x和y不在同一level 例如省管县对企业绩效的 影响 6 multi way cluster 35 误区20 只看统计显著性 不看经济显著 性 三星拜物教 例 省管县对经济增长在1 水平下具有显著 正向影响 例 省管县对经济增长具有显著正向影响 可 以使县域年GDP增长率提升1个百分点 20年前 实证文章确实主要在乎统计显著 性 但是现

15、在不然 AEA旗下的期刊已经不再 报告统计显著性 例 样本量很大 统计显著性三星 经济显著 性很小 省管县改革使县内企业销售额增加了 0 1 36 误区20 只看统计显著性 不看经济显著 性 要报告s e 不报告t统计量 最好的状况 经济显著性和统计显著性都在 通篇统计不显著 就不好 主要结果应该能保 持3星显著 经济显著性高 但是统计显著性小 怎么办 not precisely estimated 样本量 或 估计方法的原因 检验异质性 比较分组回归的系数 不能只数 星星 37 误区21 交互项的误区 x1 x2 本身也要放 如果给内生变量x1找了工具变量z1 x2是外 生的 那么内生变量两

16、个x1 x1 x2 工具变 量也是两个z1 z1 x2 交互项的IV 平方项的IV 用了交互项 要会计算marginal effect 交互项 要用得炉火纯青 分东中西部 有意义吗 交互项与分样本 如何选择 38 误区22 衡量指标选取随意 要选择常用指标 要选择干净的指标 政府竞争程度 人均FDI 官员晋升压力 第二任期 逃税 腐败 要多选择一些 做各种稳健性检验 39 误区23 不细究X的VARIATION 为什么要细究x的variation 识别 就是依靠variation 知道variation来自哪个层面 横截面还是时间 知道了variation 才能帮助判断内生性 数据描述 制度背景 不重视Variation的常见错误 1 X的variation太小 DID时treatment group内的 观测值太少 比例太小 例 征地拆迁农民 2 用错虚拟变量 40 变量的显著性检验 的标准误如下 41 误区24 用错虚拟变量 过度使用虚拟变量 导致完全共线性 例1 一个地级市内下辖县数量对经济增长的影响 X 不随时间变化 因此不能控制地级市固定效应 例2 控制企业固定效应 同时又控

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号