从AER学习DID方法的最经典文献, 当时没有之一

Original 因果推断研究小组计量经济圈 2022-05-11

收录于合集

#计量圈TOP5 62 个

#计量圈DID 65 个

#计量圈双重差分 30 个

凡是搞计量经济的，都关注这个号了

稿件：econometrics666@126.com

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

可以自行搜索一下，计量经济圈公众号搜索功能及操作流程演示

正文

关于下方文字内容，作者: 亢延锟（kangyankun@126.com）

今天给大家带来的是一篇发表在AER上的关于DID方法运用的经典文章，内容是Compulsory Licensing: Evidence from the Trading with the Enemy Act，这个论文的中心思想是研究在没有经过外国专利所有者同意情况下，一些发展中国家实施强制许可制度，即允许本国公司利用外国专利生产最终会促进还是抑制本国的发明创造。

为了检验该命题，本文借助于一战后1917年10月6日通过的敌对国家贸易法案（TWEA）这个外生的自然实验，利用美国专利与贸易办公室（USPTO）有机化学产业业中19个主行业（下含7248个子行业）1875-1939年的数据，其中336个子行业是受到了强制许可制度影响的处理组，结果显示受强制许可影响的子行业的国内技术发明得到了极大的增长，在那些至少得到一个强制专利许可的子产业在TWEA法案出台后，相比那些未强制许可行业的技术发明平均每年要多0.151个，比平均水平的0.619个技术发明要高出25%。

同时还验证了国内企业通过干中学方法，利用外国技术发明然后形成自己的生产能力的影响机制。本文思路简单明了，其最出彩的地方就是在DID之后，通过DDD、IV、falsification test等检验进行了大量稳健性分析，保证了结果的稳健性，堪称DID的范本文献。

在介绍这篇文章具体是如何使用did的时候，我想先说一点，其实有很多时候写作要比方法重要得多，同样的食材顶级厨师和一般人做出的菜当然味道不一样，论文也是如此，所以我在开始之前还是想给大家看看，顶级的作者是如何展开论述，引出问题的。下面，我把引言和背景的段落梗概列出来，看看大牛是如何一步一步开展论证的。

Paragraph1：首先陈述事实，强制许可的一些好处；其次说明有一些反对的声音。

Paragraph2：直接点出一个一直以来被忽视的问题（本文的研究）。有可能促进，有可能降低，并说明原因。

Paragraph3：为了检验上述问题，我们利用了Trading with the Enemy Act (TWEA).作为政策冲击，并检验介绍TWEA的内容。

Paragraph4：为了达成以上目的，我们是如何构建DID的。利用政策影响前后不同行业发明专利的差异，这可以使我们排出其余干扰性的因素。

Paragraph5：介绍被解释变量：虚拟变量、数量、时长

Paragraph6：介绍被解释变量和数据格式

Paragraph7：介绍本文的主要发现。

Paragraph8：我们还检验了时间趋势，因为“干中学”需要时间。况且有证据说明处理组的研发水平在TWEA之前本身就更低。

Paragraph9：我们发现强制许可的效果是有时滞的，大概在8-9年左右。

Paragraph10：提出了潜在的质疑：政策时间和给予的专利可能是随机的，但是处理组的选取可能并不随机。首先，他有可能倾向于将专利授予那些国内产品需求较大的行业，这样我们所观测到的效应可能是强制许可和需求的交互影响。其次，也有可能是政府倾向于将专利授予那些本身发展比较差的行业。

Paragraph11：除上上述问题，我们的研究还可能面临一系列因素的干扰。例如：控制组有可能收到德国竞争者突然减少的影响。对此我们利用DDD来对此做出检验。另外我们还做了反事实检验来控制其他非观测性的因素。

Paragraph12：我们利用IV来说明解决我们刚刚提到的内生性问题。选取的IV为“敌国专利的数量”，结果发现did低估了强制许可的效果。

Paragraph13：我们还做了一系列稳健性检验，包括控制了事前的时间趋势和行业层面的差异，并且只用主行业样本进行回归，我们还用了专门的一个大类（靛蓝染料行业）来进行检验。

Paragraph14：在本文的最后一个部分，我们利用了企业层面的数据分析了只有杜邦公司有的专利和其余大家共享的专利做了比较，发现两种机制都很重要，但是杜邦独享的专利对自身的研发促进作用要更强。

Paragraph15：介绍了接下来本文的安排。

下面开始计量部分：

首先，作者用几段内容说明TWEA作为外生冲击的外生性，也就是告诉我们这个自然实验的合理性。

其次，介绍了数据：

①解释变量：剥夺了4500多个外国专利，其中727个被授予了化学行业中19个主行业，7248个次行业，其中336个是处理组。

②被解释变量：1875-1939年美国19个主行业中一共128953个专利。

③测量误差和衰减偏误（总是朝向零的估计量偏误,因而有衰减偏误的估计量的期望值小于参数的绝对值）

来源一：由于OCR软件识别国籍的时候造成误差。（手动整理了一部分与OCR做了比较）

来源二：行业的划分是不断变化的，为此我们控制了行业的固定效应。（我们假设只有处理组受到专利授予的影响，行业之间的扩散效应是我们不能忽视的，但是这个并不重要，因为这样只会造成结果的低估。）

1. OLS回归（利用下面这最普通的did的模型设定）

回归结果如下：

有一个问题，β只有在处理组和控制组其余所有不因TWEA所导致的不同都相同时，才是一致的估计。但是一个问题是处理组中因为战争导致德国竞争者的数目一度急剧下降，这有可能造成我们的估计偏误，于是作者统计了行业中的德国发明家的数量。结果发现，并没有证据表明，德国发明家的数量只在处理组或者控制组中减少，事实上在所有行业中的变化都是一致的。如下图：

2. 考虑事前趋势

众所周知，did的使用一个最重要的前提就是要满足平行趋势的假设，究竟这个平行趋势假设如何去检验，及如何具体操作的问题，这篇文章给我们做了一个很好的示范。具体的，用下面这个方程：

圈友们会问，这个β后面怎么跟了三个连乘项，具体的数据结构又是什么的呢，我们用如下的三张图来演示这个方程背后的数据结构（北京是处理组，上海是对照组）：

首先β×year之后数据变成了：

其次，β×year×treat变成了：

最后，β×year×treat×pre1919（这是一个虚拟变量，1919之前为1，之后为0）：

其实，所谓的事前平行趋势检验就是把上面这幅图中所有1的样本一回归，结果发现不显著，这就说明事前是平行的，如果这时候发现依然显著，这就说明你的处理组和对照组的不满足事前平行趋势假设，在政策实施开始之前就有显著不同的发展趋势。而这个回归的结果，满足要求，如下图：

3. 动态效应检验

动态效应检验其实就是把上面的事前趋势如法炮制，只不过1919年之后赋值为1就可以了。

首先是利用虚拟变量回归：

其次，解释变量不再是是不是受到法案影响，而是受到多少个专利的连续变量，这也就是所谓的连续性did。

关于这种图如何看是否显著的问题，是这样，如果上下区间（即虚线）分布在横轴上下，即不显著异于0，就是不显著，如果上下区间都在横轴上方，则显著异于0，就是显著的意思。

最后是，如果多接受一年政策的影响，行业的发明将会如何变化，课间第二和第三个检验都是在检验这个政策的边际效用，第二个是数量上的，第三个是时间上的：

4. DDD

Ddd就是三重查分的意思，顾名思义就是差中差中差，所以他肯定需要三个交互项来构造三重查分，而大家知道构造交互项的时候不能只放交互项，还要放水平项，所以方程就显得有些繁琐：

这个目的是为了解决其余非观测性因素，例如刚刚提到的德国竞争者的问题，文章中也承认其实从历史数据来看这并不重要，但是我依旧要证明给你看。因此本文引入专利发明国家这一维度，比较美国和除了德国外所有国家在TWEA发案出台前后，以及在受影响行业和不受影响行业的技术发明差异。这里DDD就是在基准DID模型基础上引入USA国别虚拟变量及其与组别虚拟变量treat和处理时间虚拟变量posttwea的交互项。结果显示那些强制许可的行业在美国比除了德国以外的国家平均每年要多生产0.087个技术发明，分年度估计结果显示主要是在1934年以后起作用，进一步支持了基本模型的估计结果。

5. 反事实检验

反事实检验就是人为的构造一个处理组，例如本文中被解释变量成了法国的发明专利，本文选取了在有机化学行业落后的法国为样本，只是将因变量换为法国有机化学相应行业在1875-1939年的专利发明数，重新进行了DID估计。由于法国没有受该法案的影响，该政策效果应该不显著，估计结果支持了该结果，因此证实了该政策确实只作用于美国企业。

结果也符合预期，确实是不显著。

6. IV

正如文中所说“实证策略最大威胁来自于美国企业的许可决定可能不是外生的，即便TWEA政策本身和美国企业的技术引进是外生的”。数据表明美国企业往往选择国内初始技术发明比较弱的行业进行许可，由于反向选择导致的内生性导致OLS结果可能低估强制许可政策的真实效果。因此本文用敌国的专利数做本国专利许可数的IV，进行了2sls估计，证实了OLS相比IV估计确实存在一定程度的下偏。

7. 控制事前时间趋势

虽然前面通过了平行趋势检验，本文仍然担心处理前处理组和参考组可能面临不同时间趋势的影响，继续在基准DID模型基础上加入各行业虚拟变量与时间趋势项的交互，处理变量仍然显著为正，进一步增强了本文的结论。需要说明的是该方法现在常用于包括did在内的面板固定效应模型估计，如果加入交互项，核心变量仍然显著，无疑结果是高度稳健的。

可以看到，比原始方程多了一个treat×t，

8. 控制主行业和时间的联合固定效应

另外一个解决平行趋势问题的方法是在基准DID模型中引入7248个子行业所属的19个主行业的虚拟变量与各年度虚拟变量交互的联合固定效应。注意这里不同于前面用的是7248个子行业，这里是用其上一层的19个主行业。因为对于本文这个7248个子行业*64年的面板数据，控制7248个子行业虚拟变量与时间趋势项只相当于引入了7248个待估系数，模型自由度完全足够。如果这里还是同样引入7248个子行业的虚拟变量和各年度虚拟变量的联合固定效应，这时候会引入7248*64个待估参数，跟样本一样大，如果还考虑其他需要估计的控制变量、子行业固定效应、时间固定效应，模型自由度为负，肯定估计不出，所以这时只有退而求其次，引入上一层主行业与时间交互，这样一来节约了自由度，同时也考虑了随时间和行业同时变化因素的作用，避免了遗漏变量可能导致的时间趋势不一致影响。这个方法在nancy qian发表在aer的一篇关于粮食援助是否会导致冲突的文章也得到了同样运用，该文把130个亚非国家划分为6个区域，控制了区域和年度的联合固定效应以避免遗漏变量的影响。

9. 排除了新创造的行业：排除了在接受其强制许可的专利时还不存在的行业

另外一个可能引起质疑的点在于，很多专利不止被发给一个行业，如何排除行业之间的交叉引用技术的影响？

于是作者只用了19个主行业的数据进行回归，从而避免上述问题。

10. 排除需求冲击：利用靛蓝染料行业

在本文的样本区间内，有可能突然因为某些事件的影响，某一行业的需求大增，市场导向使得这个行业迅速发展从而诞生了很多发明专利，作者为了排除这个因素的影响，利用二战时期由于盟军军装需求的增长，对于靛蓝染料这个行业的需求迅速增长，作者只用靛蓝燃料这个行业进行回归后发现，原结果依然十分稳健。

11. 公司级别的检验

是哪一种强制性许可促进了国内的发明？

是独享的还是大家都有的？

自己独享的机制：首先选择自己较弱的方面进行专利的引进，其次策略性的选择可以与自己的研发完美契合的专利。

其余公司有的专利：通过企业之间的技术溢出和正外部性

于是作者使用了杜邦公司的数据，由于杜邦公司是一个大公司，他牵扯到了很多行业，所以被解释变量是杜邦公司这些年中所有涉及到的行业的发明，这仍然是一个基于行业的面板数据。使用如下回归方程：

事实上看，还是独享的专利对自己的发明创造更有利。

到这里，这篇文章的大体内容也就结束了，did算是一个门槛十分低，运用起来也十分简单的政策评估方法，但是实际上这个方法虽然简单，却面临十分严苛的适用条件，目前国内的研究很多文章在关键部分的交代模棱两可，导致这一方法有滥用的趋势。话说回来，这篇文章很多检验翻来覆去的做，虽然有些繁琐，但是却让我们看到了一个标准、规范的did需要如何去证明其运用的合理性。抛开计量部分，这篇文章的行文包括开头结尾也写得十分精彩，值得大家反复阅读。

双重差分法DID

0.双重差分DID方法免费课程, 文章, 数据和代码全在这里, 优秀学人必须收藏学习！1.DID运用经典文献，强制性许可:来自对敌贸易法的证据，3.截面数据DID讲述, 截面做双重差分政策评估的范式，4.RDD经典文献, RDD模型有效性稳健性检验，5.事件研究法用于DID的经典文献"环境规制"论文数据和程序，6.广义DID方法运用得非常经典的JHE文献，7.DID的经典文献"强制许可"论文数据和do程序，8.传销活动对经济发展影响, AER上截面数据分析经典文，9.多期DID的经典文献big bad banks数据和do文件，10.因果推断IV方法经典文献，究竟是制度还是人力资本促进了经济的发展？11.AER上因果关系确立, 敏感性检验, 异质性分析和跨数据使用经典文章，12.第二篇因果推断经典，工作中断对工人随后生产效率的影响？，13.密度经济学:来自柏林墙的自然实验, 最佳Econometrica论文，14.AER上以DID, DDD为识别策略的劳动和健康经济学，15.一个使用截面数据的政策评估方法, 也可以发AER，16.多期DID模型的经典文献，big bad banks讲解"，17.多期DID的经典文献big bad banks数据和do文件，18.非线性DID, 双重变换模型CIC, 分位数DID，19.模糊(Fuzzy)DID是什么？如何用数据实现呢？20.多期DID的big bad banks中文翻译版本及各细节讲解，21.DID中行业/区域与时间趋势的交互项, 共同趋势检验, 动态政策效应检验等，22.截面数据DID操作程序指南, 一步一步教你做，23.DID的研究动态和政策评估中应用的文献综述，25.DID双重差分方法, 一些容易出错的地方，26.连续DID, DDD和比例DID, 不可观测选择偏差，27.加权DID, IPW-DID实证程序百科全书式的宝典，28.DID和DDD, 一个简明介绍, 双重和三重差分模型，29.DID过程中总结的地图展示技巧，30.DID的平行趋势假定检验程序和coefplot的其他用法，31.截面DID, 各种固定效应, 安慰剂检验, 置换检验, 其他外部冲击的处理，32.实践中双重差分法DID暗含的假设，33.过去三十年, RCT, DID, RDD, LE, ML, DSGE等方法的“高光时刻”路线图，34.计量院士首次用DID方法分析, 中国封城对新冠病毒扩散的影响！，35.截面DID, 各种固定效应, 安慰剂检验, 置换检验, 其他外部冲击的处理，36.诺奖夫妇的中国学生, “DID小公主”的成名之作, 茶叶价格与中国失踪女性之谜！，37.前沿: 反向DID, 反向双重差分法DDR全解析, 辅以实证示例！38.英诺丁汉大学校长为你讲解逐年PSM匹配-DID方法的操作, 并配上自己写的一篇范文！39.逐年PSM匹配后再DID识别因果的实证范文, 这就是逐年PSM-DID的操作范式！40.用事件研究法进行因果识别如何做? 有什么好处? 与DID结合起来潜力无穷！41.Abadie半参数双重差分DID估计量, 使你的平行趋势假设更加可信！42.弹性DID, DID的终极大法, 关于DID各方法总结太赞了！43.二重差分法分析（DID），44.比DID更加灵活的DDID政策效应评估方，45.DID思路和操作，一篇相关实证文献，46.二重差分法深度分析（DID），三重差分兼论，47.面板数据的DID估计，透彻解读，48.PSM-DID, DID, RDD, Stata程序百科全书式的宝典，49.关于DID的所有解读, 资料, 程序, 数据, 文献和各种变形都在这里，50.分位数DID, PSMDID, 政策前协变量平衡性检验操作步骤和案例，51.PSM-DID, DID实证完整程序百科全书式的宝典，52.逐年匹配的PSM-DID操作策略, 多时点panel政策评估利器，53.广义DID, DID最大法宝, 无所不能的政策评估工具，54.渐进DID专治各种渐进性政策的良药, 可试一试疗效，55.双重差分DID的种类细分, 不得不看的20篇文章，56.找不到IV, RD和DID该怎么办? 这有一种备选方法，57.在教育领域使用IV, RDD, DID, PSM多吗? 使用具体References，58.DID和IV操纵空间大吗? 一切皆为P-hacking，59.第一篇中文DID实证论文长啥样? 60.世界上第一篇DID实证论文长啥样?，61.关于双重差分法DID的32篇精选Articles专辑！62.空间双重差分法(spatial DID)最新实证papers合辑！63.空间DID双重差分方法的文献, spatial DID，64.多期三重差分法和双重差分法的操作指南，65.多期双重差分法,政策实施时间不同的处理方法，66.三重差分法运行和示例，67.如何设计双重差分法DID: 各种政策研究的最佳指南! 68.利用DID和事件研究法的Top5文章, 分析最低工资对低薪工作的影响！69.推出输出表格, 滚动回归, 事件研究, asdoc, asreg，asrol, estudy代码和解析！70.中国拖拉机vs牲畜: 事件研究法用于政策评估和因果识别, 与DID结合起来威力无穷！71.事件研究法逐步附上程序code和对应的解释, 这还不懂那就真的没办法了！72.推荐用渐进(多期)DID和事件研究法开展政策评估的论文及其实现数据和代码！

下面这些短链接文章属于合集，可以收藏起来阅读，不然以后都找不到了。

2.5年，计量经济圈近1000篇不重类计量文章，

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle

这样的洞庭湖决堤，实在让人同情不起来

李尚福、魏凤和双双被拿下，与美国一份报告是否有关？

抗洪靠嘴，堵漏靠沙？印度官员真是绝了！

有的人走了，却永远活着

圈内疯传某谣言

从AER学习DID方法的最经典文献, 当时没有之一

您可能也对以下帖子感兴趣

这样的洞庭湖决堤，实在让人同情不起来

李尚福、魏凤和双双被拿下，与美国一份报告是否有关？

抗洪靠嘴，堵漏靠沙？印度官员真是绝了！

有的人走了，却永远活着

圈内疯传某谣言

生成图片，分享到微信朋友圈

从AER学习DID方法的最经典文献, 当时没有之一

您可能也对以下帖子感兴趣