查看原文
其他

实证分析观测数据的10条检查清单, 消除实证分析中许多潜在的虚假结果

计量圈社群阿里嘎 计量经济圈 2022-05-11

凡是搞计量经济的,都关注这个号了

箱:econometrics666@126.com

所有计量经济圈方法论丛的do文件, 微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

Source: http://yiqingxu.org/public/checklist.pdf

关于Yiqing Xu,可见1.广义合成控制法gsynth, 基于交互固定效应的因果推断,2.广义合成控制法gsynth, Stata运行程序release

在过去的几年里,我一直在给研究生教授统计学和因果推理入门。我发现自己在不断重复一些非常基本的观点。下面是一个用于分析观测数据的清单,我希望它能对新的实践者有所帮助。它们非常基本,也不全面,但在我看来,它们可以消除实证分析中许多潜在的虚假结果。底线是:请先看看你的数据!

1.绘制关键变量的直方图,包括处理变量和结果变量。这些分布是高度偏态还是有异常值?

2.通过绘制图表来理解数据中缺失数据的问题,并考虑如何处理它。

3.绘制处理变量和结果变量的二元散点图,以及局部加权曲线。当你把处理变量或结果变量中的数据截断5%的极端值时,你的结果是否成立?

4.检查你的“处理”组和“对照组”组在关键的预处理协变量上是否有重叠。

5.请记住正确地使用聚类标准误——理想情况下使用blocked (wild)自助标准误。一种完整性检查是将数据折叠到指定处理组的级别,并使用折叠后的数据运行一个简单的回归,例如个体数据可以折叠到社区层面。

6.如果你的模型包含了一个交互项,检查线性假设是否看起来可信。

7.当你在分析面板数据时,了解你的处理状态变化的源头至关重要。绘制一个图来显示一个单位内的处理状态如何随时间变化,例如:

8.如果你使用双重差分设计(或使用双向固定效应模型),请绘制动态处理效应图。

9.如果您使用断点回归(RDD)设计,请为简约式(reduced form)绘制RD图。如果是模糊RDD,在第一阶段也画一个。中断时间序列设计也是如此。

10.如果使用工具变量(IV)设计,将IV估计值与OLS估计值进行比较。两者间若存在较大差异,那回归结果就值得可疑了(如果你主要关心的是OLS存在向上偏误),需要对此做出解释。当你的IV、处理变量和结果变量是连续的,绘制第一阶段和简约形式的关系图会很有帮助。


关于这些实证,可以到社群交流,互帮互助互相交流的文化,真好。

关于回归中变量的问题

1.什么时候应该使用回归分析?控制变量意味着什么?2.如何选择正确的因变量(控制变量),让你的计量模型不再肮脏,3.调节变量, 中介变量和控制变量啥区别与联系? 4.控制、调节和中介变量,系说,5.核心解释变量A不显著, 但加入变量B后, 为什么A和B都显著了?6.被解释变量比解释变量的层级更高的模型设定合理么?7.审稿: 协变量何时重要? 哪个重要, 有多重要?8.三张图秒懂, 混淆, 中介, 调节, 对撞, 暴露, 结果和协变量的复杂关系,9.因果推断专题:6.再谈混淆变量,10.什么时候需要标准化回归模型中的变量?11.因果推断专题:1.混淆变量,12.虚拟变量回归模型是什么? 政策评估的前件,13.11种与机器学习相关的多元变量分析方法汇总,14.回归中各变量的数值相差过大有事, 又有什么问题?15.哦, 不, 回归符号反了, 我们该怎么办?16.回归系数与预期相反时, 我们能够采取的方法和思路有哪些?17.显著不显著的后背是什么, 非(半)参估计里解决内生性,18.在什么情况下多增加一个自变量后, 回归的R方会变小呢?19.控制变量选择问题: 如何鉴别好或不好的控制变量?附上14篇相关文章!20.如何测度不可观测变量遗漏的严重程度, 建议各位学者看过来!21.如何选择合适的工具变量, 基于既有文献的总结和解释!22.如何选择合适的工具变量, 基于既有文献的总结和解释!23.如何测度不可观测变量遗漏的严重程度, 建议各位学者看过来!24.社会网络计量经济学是什么?测度社会关系网中的同伴效应!25.社会网络分析最新文献和软件学习手册

下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

2.5年,计量经济圈近1000篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle




数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 | 官员方言  | 微观数据 | 内部数据计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验计量经济圈组织了一个计量社群,有如下特征:热情互助最多前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存