查看原文
其他

实践中双重差分法DID暗含的假设

计量经济圈 计量经济圈 2021-10-23

凡是搞计量经济的,都关注这个号了

稿件:econometrics666@126.com

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

关于一些计量方法的合辑,各位学者可以参看如下文章:实证研究中用到的200篇文章, 社科学者常备toolkit”、实证文章写作常用到的50篇名家经验帖, 学者必读系列过去10年AER上关于中国主题的Articles专辑AEA公布2017-19年度最受关注的十大研究话题, 给你的选题方向2020年中文Top期刊重点选题方向, 写论文就写这些, 过去三十年, RCT, DID, RDD, LE, ML, DSGE等方法的“高光时刻”路线图。后面,咱们又引荐了使用CFPS, CHFS, CHNS数据实证研究的精选文章专辑!这40个微观数据库够你博士毕业了, 反正凭着这些库成了教授Python, Stata, R软件史上最全快捷键合辑!关于(模糊)断点回归设计的100篇精选Articles专辑!关于双重差分法DID的32篇精选Articles专辑!关于合成控制法SCM的33篇精选Articles专辑!最近80篇关于中国国际贸易领域papers合辑!最近70篇关于中国环境生态的经济学papers合辑!使用CEPS, CHARLS, CGSS, CLHLS数据库实证研究的精选文章专辑!最近50篇使用系统GMM开展实证研究的papers合辑!

正文
关于下方文字内容,作者:陈墨瀚,Tufts University经济系,通信邮箱:Mohan.Chen@tufts.edu
双重差分法(difference-in-difference, DID)对我们的读者来说应该不陌生了,这是一种通过比较对照组和实验组在干扰施加前后的不同来推断实验影响的方法。双重差分法的关键是“平行路径”(Parallel Paths)假设,该假设提出,对照组的平均变化代表着实验组在没有实验的情况下会发生的变化。该方法较为流行的部分原因是其并不要求繁重的数据——它只需要两组对象在同一时间点的数据即可,而且只要不违反“平行路径”假设,其结果对任何可能的干扰因素都是稳健的。如果实验前几个时期的数据是存在的,那么研究者可以通过测试实验前对照组和实验组的不同来满足“平行路径”假设。然而从构建实验和对照组的角度来说,这一假设是无法验证的,实验前的相同特征仅仅能够提供一定的可信度,并不能直接证明“平行路径”假设。研究者还会通过在实证模型中纳入对照组的时间哑变量以及时间趋势差异参数(parametric time trend differential)来明确结果变量的“自然变化”(natural dynamics)。
研究者对双重差分法的实际运用通常就到此为止了。然而最近一项来自于Ricardo Mora 和 Iliana Reggio的研究则表明,DID作为研究者们常用的研究方法,可能还隐含着其他足以影响实验效果的假设。这些假设涉及到结果变量的“自然变化”,实验前后的影响,以及“平行路径”假设相关的特定动态模型的含义。
如前所述,研究者们通常在双重差分中使用线性(linear trend)模型等参数形式来模拟时间趋势。然而,一旦采用这种形式的线性时间趋势,识别假设就从标准的“平行路径”变为“平行增长”(Parallel Growths):此时,趋势线的偏离既代表着实验影响。(或者,我们可以把平行增长看作是平行路径假设中的一重差分)。
从平行路径到平行增长的转变突出了一条推理线,即Ricardo和Iliana正式扩展到对高阶差分(如双重差分的差分,difference of double-differencing,常被称为平行加速假设Parallel Accelerations assumption)有效的平行假设(Parallel Assumptions)族。可以说,与普通平行路径假设相比,高阶平行路径假设所提供的识别假设(identifying assumptions)较弱——我们不再需要比较组中的趋势来表示实验组的反事实趋势(counterfactual trend),而需要对照组中的增长(即趋势变化)来表示反事实的增长(counterfactual growth)。但是,由于数据的差异会加剧结果度量中存在的任何度量误差(measurement error),因此在我们的实证模型中需要权衡取舍。综上,我们可以从高阶平行路径假设中受益的程度取决于我们的数据情况。
Ricardo和Iliana提出了一个完全灵活,动态变化的通用加性回归模型(additive regression model)——该模型的优点是能够测试对动态变化的可能限制,而不是简单地提出特定的参数形式。该模型也没有在其他平行假设之间施加等价性。事实上该模型可以用来测试这种等价性:
该模型可以完全灵活的比较实验组和对照组之间在实验前的趋势差异,并且还可以比较任意两个连续的平行假设,例如平行路径与平行增长。在这里,Y是研究人员感兴趣的结果变量,时间从t1到T,实验则开始于t2和T之间的某个时间点。二元变量I表示时间段,而D表示实验单位(treated units)。在实践中,即使数据允许这种更灵活的模型,研究人员通常也会采用比该模型更严格的实证等式。这里有一篇使用该模型来研究美国学校分散化的影响的论文。
Ricardo和Iliana研究了过去三年中在十种著名经济期刊上发表的所有采用双重差分法的论文,并着重研究了那些(a)采用的双重差分模型具有多个实验前时间段以及(b)数据公开可得的论文。符合这些标准的论文有九篇。这些论文的研究主题从夏令时对美国居民用电的影响到与第一次世界大战有关的男性死亡率对法国婚姻市场的影响。与上述模型相比,所有九篇论文都采用了更具有限制性的实证模型。实际上,在九篇论文的十三个实证模型中,大多数都假设实验前对照组和实验组具有相同的动态变化。大多数模型还假设实验后的实验效果是恒定的,因此忽略了可能的实验结果的动态变化。
在上述论文中,十三个实证模型中有十一个中报告了显著的实验效果。相反的是,Ricardo和Iliana将上述弹性模型应用于数据,他们发现:
  • 十一个报告显著实验影响的模型中,一旦使用上述完全灵活的实证模型和明确的“平行路径”假设重新进行检验,只有五个继续保持精确估计,而且十一个模型中许多得出明显不同的点估计(point estimates)。

  • 一旦使用平行增长假设,精确估计的模型数量下降至三个。

  • 在实证模型的实验效果恒定性(constancy)测试中,十一个显著模型里有六个拒绝了没有动态变化的假设。这似乎表明实验后的动态变化影响通常很重要,且在理想情况下应该被纳入到更灵活的建模方式中。

  • 在平行增长和平行路径等价性测试中,十三个实证模型中里有五个拒绝了等价性假设。在这些情况下,平行增长的假设可能会较弱,导致发现的结果与基于平行路径假设的结果大不相同。

现在,的确如此,完全灵活模型(fully-flexible model,尤其在平行增长假设下使用一阶差分数据first-differenced data检验)通常具有更高的标准误,而且在许多情况下,已发表论文中报告的实验效果与使用灵活模型下的估计值之间的等价性不能被拒绝。正如Ricardo和Iliana总结的那样,“采用完全灵活模型后,我们获得的结果在符号和显着性水平上与大约三分之一的原始结果一致。我们认为这显示出在许多实证应用中所采用的模型都具有过高的限制性。”
因此,请重新考虑我们的双重差分模型。在数据允许的情况下,上面提出的更灵活的模型可以作为任何双重差分分析开始时的基准,以测试其他平行路径假设和其他动态模型的稳健性。至少,该操作可以给出更有效的简约模型的指导。
Ricardo和Iliana目前正在编写一个do.file,它能够针对平行假设等效性或动态性实施许多测试。当他们准备共享时我们将发布一个链接。

Reference: Ricardo Mora and Iliana Reggio, “The often (unspoken) assumptions behind the difference-in-difference estimator in practice”,

https://blogs.worldbank.org/impactevaluations/often-unspoken-assumptions-behind-difference-difference-estimator-practice

关于DID双重差分法,各位学者可以参阅如下文章:1.DID运用经典文献,强制性许可:来自对敌贸易法的证据2.连续DID经典文献, 土豆成就了旧世界的文明3.截面数据DID讲述, 截面做双重差分政策评估的范式4.RDD经典文献, RDD模型有效性稳健性检验5.事件研究法用于DID的经典文献"环境规制"论文数据和程序6.广义DID方法运用得非常经典的JHE文献7.DID的经典文献"强制许可"论文数据和do程序8.传销活动对经济发展影响, AER上截面数据分析经典文9.多期DID的经典文献big bad banks数据和do文件10.因果推断IV方法经典文献,究竟是制度还是人力资本促进了经济的发展?11.AER上因果关系确立, 敏感性检验, 异质性分析和跨数据使用经典文章12.第二篇因果推断经典,工作中断对工人随后生产效率的影响?13.密度经济学:来自柏林墙的自然实验, 最佳Econometrica论文14.AER上以DID, DDD为识别策略的劳动和健康经济学15.一个使用截面数据的政策评估方法, 也可以发AER16.多期DID模型的经典文献,big bad banks讲解",",17.多期DID的经典文献big bad banks数据和do文件18.非线性DID, 双重变换模型CIC, 分位数DID19.模糊(Fuzzy)DID是什么?如何用数据实现呢?20.多期DID的big bad banks中文翻译版本及各细节讲解21.DID中行业/区域与时间趋势的交互项, 共同趋势检验, 动态政策效应检验等22.截面数据DID操作程序指南, 一步一步教你做23.DID的研究动态和政策评估中应用的文献综述24.连续DID经典文献, 土豆成就了旧世界的文明25.DID双重差分方法, 一些容易出错的地方26.连续DID, DDD和比例DID, 不可观测选择偏差27.加权DID, IPW-DID实证程序百科全书式的宝典28.DID和DDD, 一个简明介绍, 双重和三重差分模型29.DID过程中总结的地图展示技巧30.DID的平行趋势假定检验程序和coefplot的其他用法
各位对第三条什么意见和建议呢?


下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

2.5年,计量经济圈近1000篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle




数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 | 官员方言  | 微观数据 | 内部数据计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验计量经济圈组织了一个计量社群,有如下特征:热情互助最多前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。

: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存