查看原文
其他

将一般DID估计推广到多期干预前和干预后时期的政策效应, 附code和数据!

计量经济圈 计量经济圈 2022-11-16

凡是搞计量经济的,都关注这个号了

稿件:econometrics666@126.com

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

关于DID,参看:1.120篇DID双重差分方法的文章合集, 包括代码,程序及解读, 建议收藏!2.诚实双重差分法DID, 面板事件研究法和Bacon分解的经典应用文!3.前沿: 多期或渐进或交叠DID, 如何进行平行趋势检验呢?4.多期DID或渐进DID或交叠DID, 最新Stata执行命令整理如下供大家学习,5.DID前沿: 5种方法估计事件研究的因果效应, 并使用绘制系数和置信区间, 详细代码和数据,6.事件研究法开展政策评估和因果识别, 分享8篇提供数据和代码的文章,7.推荐用渐进(多期)DID和事件研究法开展政策评估的论文及其实现数据和代码!8.机器学习已经与政策评估方法, 例如事件研究法结合起来识别政策因果效应了!

计量经济圈公众号搜索功能及操作流程演示

正文

关于下方文字内容,作者:谢立成, 中南财经政法大学财政税务学院,通信邮箱:xielicheng666@126.com
作者之前的文章AER未监测的污染, DID和事件研究法运用的典范(附代码)
Cerulli G, Ventura M. Estimation of pre- and posttreatment average treatment effects with binary time-varying treatment using Stata. The Stata Journal. 2019;19(3):551-565.

In this article, we describe tvdiff, a community-contributed command that implements a generalization of the difference-in-differences estimator to the case of binary time-varying treatment with pre- and postintervention periods. tvdiff is flexible and can accommodate many actual situations, enabling the user to specify the number of pre- and postintervention periods and a graphical representation of the estimated coefficients. In addition, tvdiff provides two distinct tests for the necessary condition of the identification of causal effects, namely, two tests for the so-called parallel-trend assumption. tvdiff is intended to simplify applied works on program evaluation and causal inference when longitudinal data are available.

一、摘要
在这篇文章中,我们详述了一个社区贡献的命令tvdiff ,它提供了双重差分估计的一般化估计,使其适用于有干预前和干预后的二元时变处理的情况。tvdiff很灵活,可以适应许多实际情况,使用户能够指定干预前和干预后的时期数,并以图形方式表示估计系数。此外,tvdiff为识别因果效应的必要条件提供了两种不同的检验,即对所谓的平行趋势假设的两种检验。tvdiff旨在简化有面板数据时的项目评估和因果推断的应用工作。
二、引言
在这篇文章中,我们介绍了社区贡献的命令tvdiff,它实现了将一般双重差分(DID)估计推广到许多期干预前和干预后时期的情况。tvdiff估计了当处理变量是二元并且随时间变化的平均处理效应(ATE),允许用户通过选择干预前和干预后时期的数量来估计干预前和干预后的效果。结果会自动绘制成一个易于阅读的图表中。此外,为了评估主要识别假设的可靠性,tvdiff允许人们检验基本计量经济学模型所隐含的平行趋势或共同趋势假设。为此,tvdiff进行了两项检验:一项使用时间的预期项(time lead),另一项使用额外的时间趋势变量。
本文的结构如下。第2节介绍了估计模型所依据的计量经济学知识,并展示了一个估计系数的图表。第3节解释了平行趋势检验的基本原理,并说明了如何进行检验。第4节介绍了tvdiff的语法和对该命令选项的详细解释。第5节通过比较普通最小二乘法(OLS)和固定效应估计的结果来说明tvdiff的用途,该估计是在假设有隐藏选择偏差的情况下对模拟数据生成过程(DGP)进行的。第6节提供了对真实数据的应用,衡量公共教育支出对国家层面的收入平等的影响。第7节对文章进行了总结。
三、模型设计
本文主要研究二元时变处理条件下处理效应的估计问题。这种环境是若干经济和社会政策以及长期进行的医学试验的特点。例如,人们可能有兴趣评估某种方案是否对给定的目标变量产生了一些延迟的影响,以及是否发生了预期效果。为了使这个设定形式化,让我们从考虑个体i在t时刻的二元处理指标开始:

让我们也假设一个结果方程,即同期处理变量Dit加上一个滞后期处理变量Dit-1和一个预期处理变量Dit+1。
在(1)中,β+1系数表示处理发生前一个时期的影响,β−1表示处理发生后一个时期的影响。Xit是一个协变量向量,γ是它的估计系数向量,µ表示一个固定效应。Autor(2003)提供了(1)式所代表的处理模型的第一个应用。
现在,让我们假设在[t−1,t+1]区间内,只发生一次政策冲击,因此我们可以定义以下可能的处理序列,

序列w1是未接受政策处理的基准情况。一般序列表示为wj (j= 1,2,3,4),相关的潜在结果为Y(wj)。“两个潜在结果Y(wj)和Y(wk)之间的ATE”可以很容易地定义为

在条件均值独立的条件下,即在控制了Xit和固定效应Uit的条件下,可以得到
在这样一个模型中——政策只在三个时期中被执行一次,加上处理变量的一个滞后项和一个预期项——我们可以定义六种可能,为了便于参考,我们将其放在一个矩阵中。

其中一般ATEjk表示序列j对反事实序列k的平均处理效应那个。显然,ATEjk=−ATEkj。利用(1)式和j= 1到4时wj的定义,我们可以证明

一般来说,人们得到的ATE数量等于(J2-J)/2,其中J是处理序列的数量;在我们的例子中,我们有(42-4)/2=6个ATE。动态处理效应模型的一个重要优势是能够以图形的方式描绘处理效应随时间的演变。为此,让我们把给定的处理序列对Yit的预测定义为:

与计量经济学的实践一致,为了使(3)可以计算,我们假设µit具有可加性;也就是说,µit=θi+δt,其中θi和δt分别代表个体和时间维度的固定效应。因此,µit≡E(µit|Dit-1, Dit, Dit+1, t) =E(µit|t) =E(θi+δt|t) =θ+δt。
为了简单起见,让我们只关注两个特定处理序列

其中wT表示只在时间点发生政策处理的序列,wC表示政策处理前的情况。通过设置Ait={Dit-1, Dit, Dit+1, t}和迭代(3)式滞后一期和提前一期,我们可以得到Y在t-1,t和t+1的预测值.

上式可用于计算在t−1,t, t+1条件下wT和wC的预期结果。因此

现在,我们可以绘制出这些随时间变化的预测(图1),并描述这些情况:

图1 一项政策的预期(t−1)和滞后(t+1)期处理效应
数据来源:Cerulli (2015,202)
如果β+1不为0,那么在时间段提供的处理对上一期的结果产生影响。当前的政策效应对过去的结果有影响(预期效应)。因此,政策处理前的时期会受到当期政策的影响。
如果β0不为0,在时间段提供的政策对时间段的结果产生影响,产生同期效应。
如果β-1不为0,在时间段提供的处理对下一期的结果产生影响。当前的政策效应对未来的结果有影响(滞后效应)。因此,政策处理后的时期会受到当期政策的影响。
四、平行趋势假设检验
按照Granger(1969)的理解,预期的形式对于检验因果关系也很重要。事实上,在控制控制变量和固定效应的条件下,如果Dit导致了Yit,那么在像(1)式这样的方程中,预期的系数在像(1)式这样的方程中至少有一个为零。那么进行所有β+s是否都等于零的检验,其中s= 1, . . ,S,则间接检验了平行趋势假设是否成立。从形式上看,我们可以将这种检验定义为

请注意,拒绝H0意味着对估计值的因果解释无效,而不拒绝H0只是平行趋势成立的必要条件,因为其充要条件仍然是不可检验的,因为它是用反事实、不可观测的变量来表述的。
检验平行趋势假设的另一种方法(仍然是一个必要条件)需要从(1)式中删除滞后期和提前期,并在方程中增加时间趋势变量 t以及它与Dit的交互作用。如果交互项的系数在统计上不显著,我们可以合理地认为平行趋势假设成立(见 Angrist和Pischke [2009,238-239])
为了提供这种检验的依据,让我们写出以下潜在结果模型:

我们再次考虑单个固定效应(θi)和时间效应(δt),参数λ1和λ0分别为处理和未处理的时间趋势。这样,把前两个方程代入第三个方程,就得到:

其中ηit= [u0,it+Dit(u1,it-u0,it)]。等价地,我们可以把前面的方程写成

可以通过固定效应回归来持续估计,其中λ=(λ1-λ0)的显著性检验提供了平行趋势假设的检验。λ= (λ1-λ0)的显著性检验提供了对平行趋势假设的检验。接受 λ= 0,意味着接受平行趋势假设没有被违反的假设。只要我们假设没有 "预期效应"。
最后,请注意,我们还可以通过考虑二次或甚至三次时间趋势来扩展前面的检验。
五、TVDIFF 命令
简述
tvdiff在像刚才讨论的那样的背景中估计ATEs,即,当处理变量是二值的并随时间变化时。使用tvdiff,我们可以通过选择干预前和干预后的时间段来估计干预前和干预后的效果,并将结果绘制在易于阅读的图表中。为了评估用户指定模型的结果的因果解释的可靠性,tvdiff允许使用两种检验对平行趋势假设进行检验,即对先导的联合检验和时间趋势检验。tvdiff是DID方法在许多干预后和干预前时间的推广。
其具体语法及命令请在STATA中输入help tvdiff
六、在存在选择偏差的情况下使用模拟数据的实际应用
这个示例展示了如何正确运行tvdiff,并展示了它如何解决在真实的因果推断应用程序中经常出现的选择偏差。为此目的,我们设计了一个模拟的dgp允许在“选择方程”或“处理方程”(d方程)和“结果方程”(y方程)之间的非零相关性,这是由于存在不可观测的选择问题,被作为混杂因素的个体特定效应所捕获。考虑(1)相同的处理设置;也就是说,只包括一次干预前Dit-1和一次干预后Dit+1。在不损失一般性的情况下,排除可观测到的混杂因素。下面我们证明(1)可以由三种处理组成的广义潜在结果模型推导而来,即(2)式中列出的处理序列:

假设预期结果以以下形式呈现

其中ujit=ci+εjit。ci代表个体固定效应,εj代表一个纯随机冲击,βj是一个待估计的参数。通过将(5)代入(4),我们可以看到

除了xit之外,方程(6)等同于(1),在规定β-1=β2-β1,β0=β3-β1,β+1=β4-β1,µit=β1+ci,最后,uit=ηit。利用ATEjk的定义,我们最终可以将(6)改写为

我们现在可以进行模拟实验通过使用固定效应模型(fe)展现tvdiff,不同于混合回归模型(ols),可以解决不可观测因素导致的选择问题。DGP 使得个体效应 ci 通过误差项和 Di 的选择方程同时进入到潜在结果中:

请注意,ci以非线性方式进入潜在结果的随机冲击,ujit。这一选择取决于这样一个事实,即Dit在DGP中被建模为二元和非线性,因此需要在潜在结果方程中采用非线性形式的固定效应,以产生大量的OLS偏差。以下是该DGP的代码.

正如预期的那样,由于结果方程和这个DGP所带来的选择方程之间的相关性,OLS的估计值有严重的偏差。领先者的OLS系数--预计等于30--实际上等于65,而同期和滞后的系数也出现了很大的偏差(分别为56而不是20,44而不是10) 。相反,固定效应模型表现良好,所有系数都接近真实系数,从而表明它有效地解决了这个DGP的选择偏差问题。在之前的DGP中引入外生变量并没有改变这些结果。
七、公共教育支出对收入平等影响的实际应用
在本节中,我们将提供一个tvdiff在实际数据中的应用。我们使用tvdiff来衡量公共教育努力对国家收入平等的影响。为此,我们使用Castellacci和Natera(2011)的纵向数据来构建cana.dta。这一数据集是一套丰富而完整的数据集,包含134个国家在1980-2008年期间的41项指标,共3886个国家年的观测结果。Castellacci和Natera(2011)的数据是公开的,允许对国家系统、增长和发展进行详细的跨国家分析。在这些数据中,公共教育努力被衡量为(流动和资本)教育公共总支出占国内生产总值(GDP)的百分比(变量es12educe),而收入平等被衡量为基尼指数的补充(变量sc8ginii)。在本应用中,我们将Castellacci和Natera(2011)中的下列协变量视为控制变量:
i3teler:电信收入。来自固定电话、移动和数据等电信服务的收入占gdp的百分比。
i4elecc:电力消耗。火电厂和热电厂联合生产少输、配电、变电损失和热电厂自用。
i6telecap:移动和固定电话用户。每1000名居民的电话用户总数(固定电话加移动电话)。
ec16openi:开放性指标。(进口+出口)/ GDP。购买力平价,2000美元。
sc20trust:大多数人都是值得信任的。“同意”这一说法的受访者百分比。ec14credg:银行部门国内信贷。包括对各部门的信贷总额,但对中央政府的信贷净额占gdp的比例除外。
pf20demoa:民主和独裁指数。民主:政治参与是充分和竞争性的,行政人员的招聘是可选的,对首席执行官的限制是实质性的。独裁:限制或压制政治参与。指数范围从+10(民主)到−10(zhuanzhi)。
二元处理变量D的定义如下:考虑公共教育支出占GDP的 "内部 "中位数,即1980-2008年期间公共教育支出占GDP的比例的国家中位数。如果在t年,国家i的公共教育支出大于其 "内部 "中位数,那么Dit=1(这对country—year序列因此被 "处理");否则,Dit=0。换句话说,处理组被定义为一个国家在特定年份与基线参考相比提高其教育支出的趋势,衡量为其在整个时间跨度中的表现。结果被衡量为 "公共教育支出总额占GDP的百分比"。
我们通过运行以下代码来完成这个练习,其中tvdiff与五个预处理期和九个滞后处理期一起使用:

为了简洁起见,省略回归输出结果,以确保通过两个平行趋势检验,我们关注图2中的图。这一数据显示,从处理时间(即高于教育支出中位数)开始,收入分配平等水平的ATE急剧上升,并一直保持为正值,直到处理后的第七年。

图2 国家公共教育投资与收入平等之间关系的前后模式图
这种模式是一种抛物线,表明教育支出在中位数以上的短暂增长的影响是短暂的,在处理后7年左右会逐渐消失。考虑到在处理时间(t)后3、4、5年显著性相对较高,这一发现表明教育公共投资对收入平等的作用相当明显。更具体地说,我们看到处理和未处理组之间的(平均)平等指数差异在政策处理后3年和4年达到约0.5%的值,然后在随后的几年里下降。
当然,其他可能的混杂因素也可能存在。然而,使用固定效应模型估计应该减轻不可观测的选择偏误,从而使这些结果也足够稳健。这是tvdiff帮助扩展DID应用的主要优点之一。
八、结论
在这篇文章中,我们介绍了tvdiff,这是一个由社区贡献的命令,用于估计二元处理和随时间变化的ATE。我们介绍了tvdiff拟合模型所依据的计量经济学,并展示了对估计效果进行绘图的可能性。随后,我们展示了两个平行趋势检验的逻辑以及如何用tvdiff进行检验。最后,我们介绍了命令的语法,并提供了两个应用:一个是模拟数据,一个是真实数据,评估了公共教育支出对收入平等的影响。

附上code和结果,可以下载相关代码进行操作。

clear

set obs 5

set seed 10101

gen id=_n

expand 50

drop in 1/5

bys id: gen time=_n+1999

gen D=rbinomial(1,0.4)

gen x1=rnormal(1,7)

tsset id time

  forvalues i=1/6{

  gen L`i'_x=L`i'.x

  }

bys id: gen y0=5+1*x+ rnormal()

bys id: gen y1=100+5*x+90*L1_x+90*L2_x+120*L3_x+100*L4_x+90*L5_x +90*L6_x +  rnormal()


gen A=6*x+rnormal()

replace D=1 if A>=15

replace D=0 if A<15

gen y=y0+D*(y1-y0)

tsset id time


xi: tvdiff y D x , model(fe) pre(6) post(6) vce(robust) graph save_graph(mygraph)

//其中,y为结果变量,D为二值时变处理变量,x为协变量,模型选择的固定效应模型,模型中加入政策处理变量的滞后和提前6期的项,画出动态效应图并作出共同趋势假设检验。



直接显示结果通过平行趋势检验


下这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

3.5年,计量经济圈近1000篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle




数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 | 官员方言  | 微观数据 | 内部数据计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验计量经济圈组织了一个计量社群,有如下特征:热情互助最多前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存