前沿: 反向DID, 反向双重差分法DDR全解析, 辅以实证示例！

Original 计量经济圈计量经济圈 2021-10-23

收录于话题 #实证研究中常用计量方法小集子 107个内容

凡是搞计量经济的，都关注这个号了

稿件：econometrics666@126.com

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

关于DID双重差分法，我们引荐了1.DID运用经典文献，强制性许可:来自对敌贸易法的证据，2.连续DID经典文献, 土豆成就了旧世界的文明，3.截面数据DID讲述, 截面做双重差分政策评估的范式，4.RDD经典文献, RDD模型有效性稳健性检验，5.事件研究法用于DID的经典文献"环境规制"论文数据和程序，6.广义DID方法运用得非常经典的JHE文献，7.DID的经典文献"强制许可"论文数据和do程序，8.传销活动对经济发展影响, AER上截面数据分析经典文，9.多期DID的经典文献big bad banks数据和do文件，10.因果推断IV方法经典文献，究竟是制度还是人力资本促进了经济的发展？，11.AER上因果关系确立, 敏感性检验, 异质性分析和跨数据使用经典文章，12.第二篇因果推断经典，工作中断对工人随后生产效率的影响？13.密度经济学:来自柏林墙的自然实验, 最佳Econometrica论文，14.AER上以DID, DDD为识别策略的劳动和健康经济学，15.一个使用截面数据的政策评估方法, 也可以发AER，16.多期DID模型的经典文献，big bad banks讲解","，17.多期DID的经典文献big bad banks数据和do文件，18.非线性DID, 双重变换模型CIC, 分位数DID，

19.模糊(Fuzzy)DID是什么？如何用数据实现呢？20.多期DID的big bad banks中文翻译版本及各细节讲解，21.DID中行业/区域与时间趋势的交互项, 共同趋势检验, 动态政策效应检验等，22.截面数据DID操作程序指南, 一步一步教你做，23.DID的研究动态和政策评估中应用的文献综述，24.连续DID经典文献, 土豆成就了旧世界的文明，25.DID双重差分方法, 一些容易出错的地方，26.连续DID, DDD和比例DID, 不可观测选择偏差，27.加权DID, IPW-DID实证程序百科全书式的宝典，28.DID和DDD, 一个简明介绍, 双重和三重差分模型，29.DID过程中总结的地图展示技巧，30.DID的平行趋势假定检验程序和coefplot的其他用法，31.截面DID, 各种固定效应, 安慰剂检验, 置换检验, 其他外部冲击的处理，32.实践中双重差分法DID暗含的假设，33.过去三十年, RCT, DID, RDD, LE, ML, DSGE等方法的“高光时刻”路线图，34.计量院士首次用DID方法分析, 中国封城对新冠病毒扩散的影响！35.截面DID, 各种固定效应, 安慰剂检验, 置换检验, 其他外部冲击的处理，36.诺奖夫妇的中国学生, “DID小公主”的成名之作, 茶叶价格与中国失踪女性之谜！等等。

正文

关于下方文字内容，作者：陈庆冲，东北财经大学金融工程，通信邮箱：yukichen1213@163.com

作者之前的文章：最全: 深度学习在经济金融管理领域的应用现状汇总与前沿瞻望, 中青年学者不能不关注！

反向DID，原文PDF附在文后。
Kim, K., & Lee, M. Difference in differences in reverse. Empirical Economics, 1-21. https://doi.org/10.1007/s00181-018-1465-0

摘要

在常用的DD（difference in differences）算法中，有一个永远不被处理的控制组和一个在某些时间节点被处理的处理组。然而，在有些DD的处理中，有一些控制组是永远被处理的（而不是永远不被处理），我们将它称作DDR（DD in reverse），即反向DID。这篇文章介绍了常用的DD方法变为DDR时，识别与估计过程应如何改变。事实证明，DDR的估计可以用与DD的估计相同的方法。相反，识别过程却截然不同，这是因为DDR本质上识别了处理前阶段的影响，而DD则识别了处理后阶段的影响。我们提供了一个关于工作时长限制法律对于实际工作时长和工资影响的经验例证，法律首先在韩国的大公司实施，而后一年后在韩国的小公司实施（即第二年），大公司组成了永远被处理的控制组，小公司组成了处理组。我们发现法律提高了韩国工人的幸福感，这是由于工作时长减少后，他们的实际周工资增加了。

引言

DD是常用于探究一个处理的影响的模型，如Angrist and Krueger（1999）、Heckman et al.（1999）等及其参考文献中被普遍使用。DD非常依赖于“同时间效应条件”，即如果处理的反事实逻辑被拒绝时，处理组和控制组将会对其效应，并平均改变相同的数量，这也被称作“平行趋势”。

在有一个处理D和效应变量Y的DD中，存在一个组（Q=1），在某一时间节点，它的处理从D=0变为D=1，另一个组（Q=0）则一直是D=0。然而，有很多DD的情况下，Q=0的组总是D=1，而不是D=0。在这些情况下，DD模型需要修改。Kotchen and Grant（2011）的研究就是一个例子，他们检验了夏时令（DST）对住宅用电的影响，使用了印第安纳州的一些县的DST变化进行研究：印第安纳州的一些东北方县（Q=1）在2006年初采取了夏时令，而其他县（Q=0）则早已采取了夏时令。也就是说，在这个研究中，Q=0组总是被处理的。

为了区分Q=0的组总是被处理与总是不被处理的情况，我们称前者为DDR。在DD中，

我们分别称Q=0与Q=1的组为控制组与对照组；而在DDR中，我们称Q=0的组为对照组，Q=1的组为变化组。通常情况下，在DD中处理前的阶段应该包含在数据中，这是为了迎合“同时间效应条件”，而在DDR中处理后的阶段也应该以相同的理由被包含。Kotchen and Grant（2011）也印证了这个观点。

一篇经济学人上的文章（November 26,2016）经过统计NBER的论文摘要中的关键词，表明DD是计量经济学研究中最流行的方法。在搜索的过程中，我们发现了另一个DDR的案例，它来自于Chemin and Wasmer（2009）。除此之外，还有一个流行且适用的DDR框架：在不同的时间跨不同的地区引入一个政策。这通常发生在州/地方自治的联邦中，在这种情况下，联邦政策在不同区域的实施时间是不同的。例如Autor et al.（2006）对于美国各州实施不当排放法的研究、Gentzkow and Shapiro（2008）对于美国各地区电视的研究、Monstad et al.（2008）对于挪威推行义务教育法的研究。虽然这些研究中没有一个明确地提到了DDR，但它们都符合DDR的研究框架。

对于DDR，我们可以将D=0重新标记为处理组，D=1标记为控制组，从而将DDR转换为DD。在颠倒时间的过程中，Q=1的组被处理（即D从1变成0）回到过去，而Q=0的组由于总是D=1，不会被处理。在这种转换后，我们回到了熟悉的DD，而时间顺序是颠倒的（我们称它为“时间颠倒的DD”）。这样，DDR看起来好像也没什么新内容。然而，有时使用DDR本身比将其转换为时间颠倒的DD要好，有如下几个原因：

首先，在一些DD中，存在多个过去年份和一个未来年份（或仅仅几个）的情况，其中多个过去的年份被用于确认未处理时的平行趋势，但如果使用时间颠倒的DD，存在单个或仅仅几个过去周期和多个未来周期，因此，我们无法验证平行趋势假设。第二，众所周知（例如参见Lee,2016b），在通常的DD中识别出的效应是针对处理后时期的，这意味着我们在时间颠倒的DD中，估计的影响是对于处理前的，但这并不是我们想要的。第三，当检验协变量条件时，时间颠倒的DD可能必须以未来的协变量为条件，但考虑到使用未来的协变量预测过去的情景，这可能会有点尴尬。

本文提到的DD的主要贡献是它确立了对于DDR的识别。更具体地说，我们表明，在相应的各种识别条件下，在DDR中存在各种处理的效果，这与在DD中的识别参数与识别条件完全不同。相比之下，DDR的估计可以按照与DD相同的方式进行，这使得DDR的估计成为一项简单的工作。尽管如此，鉴于识别差异与DD和DDR之间数据的差异（例如，DDR显示的是处理后，而不是DD的处理前），从业人员应谨慎对待如何使用常用的DD来解释DDR的估计结果。

本文的其他部分结构如下：第二节讨论了类似于Lee（2016b）的DDR识别；第三节展示了如何使用线性模型和普通最小二乘法估计（OLS）来轻松地估计DDR；第四节提供了一个使用韩国数据的实证说明，其中D是将每周法定工作时间从44小时减少到40小时的法律，Y是每周实际工作时间或实际工资；最后，第五节总结了我们的发现；附录探索了OLS估计法的一些概括。

识别

1.符号和准备

我们暂时假设只有两个周期t=2,3可用，其中转换组（Q=1）在t=3之前被处理，并且处理组（Q=0）已经被处理。t=2,3而不是t=1,2或t=0,1的原因将在稍后看到，此时需要两个以上的周期来确认我们的DDR识别条件。如果A成立，设1[A]=1，否则为0。对于索引个体i，在时间t个体i的处理虚拟变量为

2. DD处理后效应的简要回顾

在检查DDR的识别前，我们提出了两个DD的识别条件以便于比较DDR和DD。我们省略了关于DD识别条件如何导致DD识别参数的细节，因为在Lee and Kang（2006）和Lee（2016b）中可以看到类似的推导，它们下面也出现了DDR。为了简化说明，我们省略了出现的大多数协变量W。

具有重复横截面的DD为：

“相同时间效应”DD识别条件为：

它提出了：

3. DDR中被识别的影响

（1）处理前阶段对于处理的后的影响

关于DDR，DDR采取与DD相同的形式，但潜在的效应不同：

在上公式中的第二项后，减去并加上后得到：

最后四项导致了DDR的识别条件：

使用OLS估计

DDR可以非参数化地实现，但对于高维的协变量的情况，这是不切实际的。尽管到目前位置我们一直忽略了协变量，但在实践中，协变量的维度往往很高，我们可能别无选择，只能使用线性模型，这也是我们实证分析的情况。因此，本节用一个常数效应参数

来考察OLS下的DDR。为了简化论述过程，我们只考察OLS的两个周期（在附录中讨论了T周期的一般情况），其中处理组（Q=1）在某一已知时间节点向前被处理，该附录还考虑了通过允许与一些协变量

相互作用来平衡常数效应假设。

在的情况下，我们对的基本线性模型为：

法定工作时长减少的影响

1. 数据来源与DDR特征

在韩国，一项将每周法定工作时间从44小时减少到40小时的法律于2004年7月生效。如果雇主违反了法律，他/她将被监禁两年以下，或被罚款10,000美元。法律的执行一直很松懈，因为法律会以各种方式伤害雇员或雇主。因此，尚不清楚法律在多大程度上减少了实际工作时间。此外，工作时间的减少可能会导致小时工资的变化。在这一部分，我们评估了法律对三个反应变量的影响:实际每周工作时间、每小时实际工资和每周实际工资，这是前两个变量在个人层面上的结果。

许多研究分析了法定/标准工时减少对实际工时或实际工资的影响。首先，法定/标准工作时间减少1%，对实际工作时间的影响从几乎没有影响（Brunello 1989;Kawaguchi et al.2017;都用了日本数据）到轻微的负面影响（Skans 2004; Raposo and van Ours 2010;都用了欧洲数据）或接近1%的减少(Hart and Sharot 1978; Franz and Konig 1986; Hunt 1999;都用了欧洲数据）；其次，由于工会的力量，对小时工资的影响可能会有所不同，从标准工作时间减少时要求的不变（Chemin and Wasmer,2009），到轻微的0.1%的增长（Pencavel and Holmlund,1988），一个0.27%的增长（Skans,2004），一个0.9~2.1%的增长（Raposo and van Ours,2010），一个2~2.4%的增长（Hunt,1999）。这些增加似乎是为了使实际工资不受影响，事实上，Hunt（1999）、Skans（2004）、Raposo and van Ours（2010）并没有证实真实的每月工资变化。更多参考资料见Kawaguchi et al.（2017）。许多研究提供微观经济模型，从理论上预测/解释经验结果。

我们的数据中出现了DDR特征，因为韩国法律最初只适用于拥有1000多名员工的大公司，然后逐渐扩展到较小的公司。根据公司规模，法律适用的准确时间是：

我们关注前两种类型的公司:拥有1000多名员工的公司和拥有300-999名员工的公司。前者公司规模较大，在2005年构成了被处理组，因为它们总是被处理，而后者公司规模较小，构成了被转换组，因为它们只是在2005年才被处理。我们只检查每周工作至少30小时的个人，每年每组大约有2000到3000人。

我们的数据来源是韩国就业信息服务局职业就业统计中2004年和2005年的重复横截面。我们还使用2002年、2003年和2006年来绘制下图。重复的横截面与每年的九月有关；也就是说，被调查者被问及他们今年9月的信息。2003年和2004年的数据也用于通常的DD分析，因为2003年没有对任何公司进行处理，这为比较2003-2004年的DD影响和2004-2005年的DDR影响提供了机会。

我们提出了两种类型的分析。一种是基于平均的方法，不考虑协变量。另一种是使用两种方法对协变量进行控制：前一节中的OLS方法和Abadie（2015）中基于倾向得分的加权方法。没有协变量的基于平均的方法可能会引起误解，但是为了简明扼要地总结DD的基本思想，它常用于DD。它可以作为一种非参数方法，因为我们可以将基于平均的方法分别应用于子样本。例如，用两个时间常数虚拟变量来控制——比如说Ai=0,1和Bi=0,1——有四个组，我们可以分别对每个组应用基于平均的方法。此外，基于平均值的方法允许我们用图表检查可测试的识别条件，并允许我们从图表中辨别处理效果。

2. 无协变量的基于平均值的分析

表1显示了不控制协变量的DDR。在左栏中，Q = 1组的工作时间减少了2.40小时，远远超过Q = 0组的减少量(0.53)；最终结果是每周工作时间的DDR效应为1.87，尽管减少的量没有法律预期的多(4 = 40-44)。工资在中间栏中以10，000韩元(约10美元)计算，Q = 1组的小时工资增加了约2.07美元，而Q = 0组的小时工资仅增加了约0.55美元。最终结果是每小时工资增加1.52美元的DDR效应。类似地，在右栏中，每周工资增加了大约48.8美元。

使用图表可以更好地了解DDR功能。图2、3和4分别显示了2002-2006年间每周工作时间、每小时工资和每周工资的平均值。在图2中，大公司在2004年(t = 2)首次处理时出现大幅下降；小公司的工作时间也减少了，尽管程度不同。然后，大公司的工作时间在2005年只下降了一点点(t = 3)，而小公司的工作时间下降的幅度更大。在图3中，大公司的工资在2004年首先增加(以补偿减少的工作时间)，而小公司的工资保持不变。然后，小公司的工资在2005年增长了几乎同样的幅度，而大公司的工资只增长了一点点。图4中每周工资的结果与图2中的结果相似，除了小公司从2003年(t = 1)到2004年(t = 2)略有下降。

2003-2004年的数据提供了一个应用DD的机会，因为在2003年没有公司被处理；然后，我们可以将2003-2004年的DD与2004-2005年的DDR进行比较。这在表3中完成，该表类似于表1，除了大公司被包括在Q = 1组中，小公司被包括在Q = 0组中；为了便于比较，表1的DDR效应在表3的底部重现。比较表3的最后两行，小公司的DDR效应比大公司的DD效应小13~32%。

3. 考虑协变量的结果

关于协变量的控制分析，表4给出了除四类工作类型(管理、教授/办事员、服务/销售和制造/临时工)和八类行业外所用变量的平均值和标准差。在表4的第一栏中，“WH”代表工作时间，“Midsch/below”是指中学或以下，而“Experience”是指工作年限。尽管在表4中被省略，但许多工作和行业模型都具有重大影响。大公司(Q = 0)的工人挣更多的钱，而且在大公司里有更多的男性。此外，大型企业的员工受教育程度更高，经验更丰富。

OLS指定了Y模型，而Abadie(2005)中的加权方法指定了“Q-倾向得分(PS)”函数E(Q|W) = P(Q = 1|W)，对此我们使用概率。严格地说，在必要的假设方面，两者都不弱于另一个，但是支持PS方法的人会认为，指定PS比指定Y模型风险更小，因为只使用预测的概率，而不是PS函数的单个系数。也就是说，指定的PS是一种简化形式，而指定的Y模型是一种结构形式，对于这种结构形式，错误的指定会有更严重的后果。

表5总结了我们的主要经验发现，其中上部分面板只控制W，下部分面板控制W及其与S的相互作用；在DDR中，t = 2005，S = 1；在DD中，S = 1，t = 2004。表5中有四个显著的特征。首先，大多数影响在统计上是显著的。其次，所有的影响都有相同的迹象，这是令人放心的。第三，所有DD效应都比相应的DDR效应有更大的幅度(除了只控制W的每周WH的权重)，因为DDR估计了对被转换公司(小公司)的影响，而DD估计了对被处理公司(大公司)的影响。第四，加权估计值往往比OLS估计值变化大得多，这是一个众所周知的加权问题，因为加权中的小分母会产生异常值。

对于已经给定的大样本量，一个相对更广泛的模型规格比一个相对不太广泛的模型规格更受欢迎，因此我们只解释了同时控制W和WS的效应，也就是说，只解释了下面的面板；同样考虑到上面提到的特征，我们只看OLS效应。首先检查DDR结果，工作时间的DDR效果为1.58，与表1中的效果1.87没有实质性差异；对于工资，影响是0.84美元，大约是表1中影响的一半(1.52美元)；对于周薪，影响是20.9美元，比表1中的影响(48.8美元)的一半略低。此外，工作时间的DD结果为1.72，比表3中的2.16小一点；对于工资，影响是1.1美元，大约是表3中影响(2.23美元)的一半；对于周薪，影响为23.7美元，不到表3中影响(69.5美元)的一半。

将我们的实证结果与文献中的结果进行比较，相对于法定工时减少4小时，实际工时减少1.6或1.7并不令人惊讶。每小时工资增加约1美元的效果，相当于相对于法定工作时间减少约10%增加约5%~7%，或多或少地证实了文献中的发现。在我们的实证分析中，相当令人惊讶的是实际月工资的显著增加，而在文献中几乎没有发现任何影响。这可能是由于韩国强大的工会，尽管韩国加入工会的劳动力比例低于大多数其他国家。

总结

在这篇文章中，我们引入了DDR来检验其对重复横截面的识别和估计，其中对照组总是被处理，而不是像通常的DD中总是未被处理。DDR有许多DD中没有的特征：首先，在仅涉及处理效应的识别条件下，DDR识别过去的（即处理前）效应，这与DD相反；第二，DDR的识别条件可以通过未来两个组的平行趋势检验，而DD只能用过去的；第三，存在不同的DDR识别条件，包括处理与未处理的效应，这使得人们可以识别DDR的未来影响，尽管该条件是限制性的。在估计方面，在DDR期望的处理效应仍然像DD中的一样，通过组和处理时间的虚拟变量的相互作用进行估计，但与DD相反的是，DDR中的组间效应不是组虚拟变量的斜率。

如果协变量位数较低，可以用非参数估计器来进行DDR的估计；否则，可以对回归方程使用OLS法或对指定的处理进行加权法。由于我们的协变量维度在实证分析中很高，我们对2004-2005年的韩国数据应用了OLS和加权法，以确定减少法定工作时间的法律的影响。该法律规定每周工作40小时，比之前的法律少了4小时，但根据OLS的估计，实际工作时间只减少了约1.6小时——不到预期效果的一半。根据OLS的数据，作为对工作时间减少的补偿，每小时工资增加了约0.84美元，每周工资增加了20.9美元。我们还对2003年至2004年(一年前)的韩国数据应用了DD，并确定DD的影响在数量上略大于DDR的影响，但它们在其他方面是相似的。总的来说，DDR和DD讲述了一个连贯的故事:由于法定工时减少法，每周工资增加，而每周工作时间减少，韩国工人的福利增加了。

附录（略）

长按以上二维码阅读原文PDF

关于因果推断，我们引荐了① 关于各种因果识别方法的120份经典实证文献汇总 ”，② 哈佛大学新修订完成的因果推断经典大作免费下载！附数据和code，③因果推断的统计方法总结, 177份文献，④政策评估的计量方法综述, 包括最新因果推断方法，⑤在教育领域使用IV, RDD, DID, PSM多吗? 使用具体文献，⑥ 看完顶级期刊文章后, 整理了内生性处理小册子，⑤工具变量精辟解释, 保证你一辈子都忘不了，⑦DID, 合成控制, 匹配, RDD四种方法比较, 适用范围和特征，⑧关于双重差分法DID的32篇精选Articles专辑！⑨关于(模糊)断点回归设计的100篇精选Articles专辑！⑩匹配方法(matching)操作指南, 值得收藏的16篇文章等，⑪MIT广为流传的政策"处理效应"读本，⑫DID的研究动态和政策评估中应用的文献综述，⑬最新政策效应评估的四种方法，⑭政策效应评估的基本问题等。

1.用"因果关系图"来进行因果推断的新技能，2.因果推断专题：因果图，3.因果推断专题：有向无环图DAG，4.confounder与collider啥区别? 混淆 vs 对撞，5.三张图秒懂, 混淆, 中介, 调节, 对撞, 暴露, 结果和协变量的复杂关系，6.中介效应检验流程, 示意图公布, 不再畏惧中介分析，7.图灵奖得主Pearl的因果推断新科学，Book of Why? 8.前沿: nature刊掀起DAG热, 不掌握就遭淘汰无疑！因果关系研究的图形工具!9.前沿: 卫星数据在实证研究中的应用, 用其开展因果推断的好处！10.7大因果推断大法精选实证论文, 可用于中国本土博士课堂教学！11.随机分配是什么, 为什么重要, 对因果关系影响几何？12.应用计量经济学现状: 因果推断与政策评估最全综述，13.疫情期计量课程免费开放！面板数据, 因果推断, 时间序列分析与Stata应用，14.Python做因果推断的方法示例, 解读与code，15.内生转换模型vs内生处理模型vs样本选择模型vs工具变量2SLS，16.不用IV, 基于异方差识别方法解决内生性, 赐一篇文献等等。

下面这些短链接文章属于合集，可以收藏起来阅读，不然以后都找不到了。

2.5年，计量经济圈近1000篇不重类计量文章，

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle

: ， . Video Mini Program Like ，轻点两下取消赞 Wow ，轻点两下取消在看

李尚福、魏凤和双双被拿下，与美国一份报告是否有关？

圈内疯传某谣言

不要放过这些人渣

“辣条二哥”直追卫龙，麻辣王子工厂遇洪受关注

中金跳楼女生诡异之处。

前沿: 反向DID, 反向双重差分法DDR全解析, 辅以实证示例！

摘要

引言

识别

1.符号和准备

2. DD处理后效应的简要回顾

3. DDR中被识别的影响

法定工作时长减少的影响

1. 数据来源与DDR特征

2. 无协变量的基于平均值的分析

3. 考虑协变量的结果

总结

您可能也对以下帖子感兴趣

李尚福、魏凤和双双被拿下，与美国一份报告是否有关？

圈内疯传某谣言

不要放过这些人渣

“辣条二哥”直追卫龙，麻辣王子工厂遇洪受关注

中金跳楼女生诡异之处。

生成图片，分享到微信朋友圈

前沿: 反向DID, 反向双重差分法DDR全解析, 辅以实证示例！

摘要

引言

识别

1.符号和准备

2. DD处理后效应的简要回顾

3. DDR中被识别的影响

法定工作时长减少的影响

1. 数据来源与DDR特征

2. 无协变量的基于平均值的分析

3. 考虑协变量的结果

总结

您可能也对以下帖子感兴趣