查看原文
其他

具有空间溢出效应的双重差分法估计最全综述, 理论和操作应有尽有!

计量经济圈 计量经济圈 2022-10-02

凡是搞计量经济的,都关注这个号了

箱:econometrics666@126.com

所有计量经济圈方法论丛的code文件, 微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

关于空间DID,参看,1.空间DID双重差分法运行和操作代码,2.空间双重差分法(spatial DID)最新实证papers合辑!3.空间DID双重差分方法的文献, spatial DID

正文

关于下方文字内容,作者:翟大业,中国人民大学自然资源管理,通信邮箱:syzhaidaye@163.com

之前的文章:1.AER: 为什么要让孩子在更好的环境中成长呢? 哈佛师徒告诉你!2.TOP5最新文靶向了中国AI公司, 使用三重差分DDD进行实证评估

具有空间溢出效应的双重差分法估计
Kyle Butts, 2021, Difference-in-Differences Estimation with Spatial Spillovers, https://doi.org/10.48550/arXiv.2105.03737

Empirical work often uses treatment assigned following geographic boundaries. When the effects of treatment cross over borders, classical difference-in-differences estimation produces biased estimates for the average treatment effect. In this paper, I introduce a potential outcomes framework to model spillover effects and decompose the estimate’s bias in two parts: (1) the control group no longer identifies the counterfactual trend because their outcomes are affected by treatment and (2) changes in treated units’ outcomes reflect the effect of their own treatment status and the effect from the treatment status of “close” units. I propose estimation strategies that can remove both sources of bias and semi-parametrically estimate the spillover effects themselves including in settings with staggered treatment timing. To highlight the importance of spillover effects, I revisit analyses of three place-based interventions.

摘要

一、摘要

实证工作通常采用按地理边界划分的处理方法。当处理效应跨越边界时,经典的DID估计对平均处理效应的估计是有偏的。本文引入了一个潜在结果框架对溢出效应进行建模,并将估计偏差分解为两部分:(1)对照组不再识别反事实趋势,因为其结果受到处理效应影响;(2)处理单位的结果变化反映其处理状态的效应和来自“邻近”单位的处理状态的效应。本文提出的估计策略,可以同时消除偏差的来源和半参数估计溢出效应本身,包括在处理时间渐进的设定下。为了强调溢出效应的重要性,对三种基于地点的干预措施的分析进行了重新审视。

二、引言

(一)主体研究内容和结果

1.介绍潜在结果框架,直接对溢出效应进行建模。
2.定义非参数识别各处理效应的条件。
3.评估常用的DID估计。结果表明,DID估计量是对总效应和直接效应的有偏估计。总效应和直接效应都存在控制单位溢出的偏差,原因在于“邻近”处理单位的未处理单位会受到处理效应的影响,因此,“控制”单位无法识别反事实趋势。(1)DID估计将对邻近控制单位的溢出平均计入未受处理单位的结果变化中。因此,溢出效应被从估计的处理效应中减去,并使估计结果与溢出效应的符号相反。如果邻近的控制单位也受益于处理,那么研究者将低估处理组的处理效应。(2)直接效应也有偏,因为处理单位结果的变化会影响其自身处理状态的效应以及“邻近”单位处理状态的效应。在DID中,对其他被处理单位的溢出效应被平均计入被处理单位的结果变化中。因此,对直接效应估计的偏差与溢出的符号相同。
4.假定溢出是局部的,在双向固定效应模型中加入一个受溢出影响的指标,可以消除处理效应估计中的所有偏差,只要该指标包含受溢出影响的所有单位。
5.创建一组距离处理单位的距离区间,并将它们与处理指标相互作用,可以得到处理效应的一致估计。
6.经验性应用:田纳西流域管理局的总效应的估计存在偏差。
7.重新审视了关于美国联邦赋权区的相互矛盾的结果。
8.将处理的直接效应和溢出效应的估计扩展到TWFE/事件研究框架中。

(二)研究贡献

1.已有文献的发现基于特定的溢出映射,重点是估计总效应;而本文首次从一般潜在结果方面考虑识别,讨论处理效应的估计和识别结果。
2.考虑事件研究框架中对直接效应和溢出效应的估计。

三、潜在结果框架

目标:将空间溢出效应正式化,正式确定在有溢出效应的设定下不再是唯一定义的处理效应。

当溢出效应取决于处理状态时,切换效应可以被认为是两个独立的效应。首先,单位因改变其处理状态而受到影响,即直接效应;其次,该单位从作为控制单位经历溢出效应变为作为处理单位经历溢出效应。
(三)DID估计了什么?
命题1(DID被估量的分解) 若假设1、2和平行反事实趋势成立,那么总体DID估计可以分解为

(四)识别处理效应
1.切换效应

四、效应的估计

(一)直接效应和总效应的估计

红线使用了单一指标(距离处理0-60英里),条形图和估计的反事实趋势之间的差异即估计的溢出效应约为0.6,掩盖了前15英里内的单位具有1或更大的处理效应,40-60英里之间的单位具有0溢出效应。
蓝线对每15英里的间隔使用了4个指标(0-15,15-30,30-45,45-60英里),改善了对单一环的估计:(1)多环可以更好地捕捉到溢出效应随距离变化的衰减性质;(2)包括在发生溢出效应的真正最大距离(45-60英里)之后的环,其点估计接近零。环法是一种半参数估计,即随着环数的增加和宽度的缩小,估计将追踪出溢出效应函数(s.t.满足假设5)。然而,估计的精确度会随着环数的增加而降低,因此,在环数和宽度上存在着偏差—方差的权衡。
使用最近的处理单位的一组指标的缺点:一些溢出效应在邻近处理单位的数量上是累加的。此时,通过与最近的处理单位的距离来代表暴露,就不能捕捉到关于其他处理单位位置的重要信息,对环状指标的系数可能会有错误的解释。
潜在的解决方案:计算每个环内处理单位的数量,而不是为最近的处理单位创建指标。然而,这种累加版本的环无法消除处理的直接效应的所有偏差,除非正确指定暴露映射。因此,如果预计溢出效应在本质上是累加的,那么对直接效应和溢出效应的单独估计将是首选方法。

五、在基于地点的政策分析中的应用

(一)对Kline & Moretti(2014)田纳西流域管理局(TVA)案例的重新审视
TVA计划是一项大规模的联邦投资,始于1934年,重点是建设大坝和运输运河,试图使田纳西流域的经济现代化。到二战结束时,TVA成为全国最大的单一电力供应商,并大大降低了工厂的能源批发成本。花费200多亿美元(按2000年美元计算),这意味着管理局的每个人都有数百美元的转移,其影响很可能会延伸到管理局的边界之外。Kline & Moretti(2014)分析了一系列结果变量,但为了简洁起见,本文仅使用农业和制造业的就业(取对数)。由于TVA主要通过大规模电气化来改善制造业,作者预测,随着工人转向高薪的制造业工作,制造业的就业将增长,而农业的就业将萎缩。
Kline & Moretti(2014)的分析首先比较了1940–1960年(短期效应)或1940–2000年(长期效应)管理局内的处理县和外部的控制县之间的县级结果变化。主要方程为

图2中列出了样本中使用的县。Kline & Moretti(2014)估计(13)以确定TVA的“地方效应”对应本文的直接效应。然而,他们的点估计部分比较了TVA县的结果变化和可能受到大规模计划影响的邻近县的结果变化。

Kline & Moretti(2014)讨论了可能发生的溢出效应的性质。(1)农业就业:管理局工资的提高将吸引农业工人离开附近的县城,预计会出现负向溢出效应。(2)制造业:效应是模糊的。如果电气化给邻近地区带来廉价的电力和集聚经济,可能会有正向溢出效应。然而,如果企业选择在管理局办公,而在没有这个计划的情况下,这些企业会决定在附近的县城办公,那么制造业就会下降。本文的方法将在数据中实证检验这些预测,并从处理效应的估计中消除它们的偏差。
通过将管理局内的县与边界另一侧的县进行比较,作者很可能低估了对农业就业的负面效应,而制造业效应的偏差在理论上是模糊的。作者确实认识到了这些比较的问题,并删除了与管理局有共同边界的县,但由于该计划的规模,溢出可能比这更远。因此,即使删除了相邻的县,估计也可能存在偏差。
本文提出的估计策略是在控制溢出效应的同时,将观测保留在TVA附近,以更严格的方式控制溢出效应。为了对暴露映射进行参数化,使用了一组环,参见“四、(二)”部分。具体来说,考虑溢出效应的方程如下:

Dist = {(0, 50], (50, 100], (100, 150], (150, 200]}以英里为单位

表1的A组:1940–2000年的长期分析结果。每一行都包含一个不同的结果变量(取对数)的结果。第(1)-(5)列包含不同方程的的点估计值,即结果变量的十年增长率。
使用不考虑溢出效应的OLS估计方程(13):第(1)列,农业就业每十年下降约5.1%,制造业就业每十年增加约5.6%。
考虑溢出效应,方程(14):第(2)列包含τ的点估计,第(3)–(6)列包含溢出效应δd的点估计。
农业就业:在管理局附近的控制单位,农业就业有所下降。0-50英里的控制单位,农业就业每十年下降3.7%,50-100英里的点估计是每十年-1.6%,100-150英里的点估计是每十年-3%,150-2000英里的点估计是每十年-1.6%。可能原因是管理局内高薪的制造业工作吸引了附近县的农场工人移民。由于对控制县的溢出效应是负的,原来的DID估计是有正向偏差的。新的点估计表明,每十年农业就业率下降了约7.4%,而标准的DID估计则是5.1%。
制造业就业:对溢出效应的点估计一直是负的,尽管在某些列中估计得不精确。从长期来看,邻近县经历了潜在的负向溢出效应。因此,第(2)列中3.5%的新点估计值明显小于原来5.6%的估计值。从长期来看,城市影子力量主导了城市进入的好处。当你离开田纳西河谷时,点估计值绝对值变得更大,这表明随着距离的增加,城市进入的好处比城市影子成本消失得更快。
表1的B组:为了了解基于地方的大规模政策的溢出效应如何随着时间的推移而发展,使用1960年的结果数据展示了田纳西河谷的短期效应。
农业就业:与长期不同的是,田纳西河谷附近的地区在短期内并未出现农业就业的明显下降。由于长期分析发现田纳西河谷的高薪制造业就业率大幅上升,这一结果与长期移民成本低于短期成本相一致。
制造业就业:在田纳西河谷管理局100英里范围内,制造业就业有可能出现正增长,而在100-200英里范围内,影响几乎为零。在短期内,城市进入和廉价的批发电力的影响似乎主导了城市影子的效应。如果运营公司不太可能搬迁,城市阴影的影响在短期内可能会比较小。长期溢出效应的估计结果表明,长期效应可能会比较大,因为新进入企业会改变他们的位置决定,而在位企业会慢慢被取代。
上述结果表明,溢出效应在直接处理效应的估计中是潜在的重要因素,并可能导致处理效应估计的显著差异。对基于地方的政策的分析,如果不考虑处理效应可以溢出处理地区边界的事实,就可能出现偏差。此外,基于地点的政策所造成的溢出效应会随着时间的推移而改变,因为摩擦会推迟再优化行为。
(二)基于地点的政策分析的识别策略
本文的贡献:
1.提出了用非综合数据估计处理效应的简单方法,在关于溢出效应的一般假设下,基于地点的政策的所有三种效应都可以被估计。
2.潜在结果框架在分析基于地点的政策的效应时提供了关于不同识别策略的重要见解。(1)如果溢出效应发生在邻近的控制单位上,那么利用边界的不连续性,将处理单位与边界另一侧的单位进行比较将是首选策略。(2)应谨慎使用依赖于地理上邻近的控制单位具有类似的不可观测因素的识别策略。如果处理影响到边界另一边的单位,那么估计的处理效应就会有偏差。例如,美国联邦赋权区的矛盾结果:联邦赋权区是否降低了贫困率。

六、估计有溢出效应的事件研究

staggered adoption:不同单位在不同时间接受处理。
为了在存在溢出效应和渐进处理时间的情况下估计处理效应和溢出效应,提出一种估计策略,即遵循Gardner(2021)和Borusyak et al.(2021)提出的“基于归因”的方法,将溢出效应直接纳入类似于方程(8)和(9)的估计。假设观测到单位i和时期t的独立同分布面板。基于归因的方法依赖于对未处理和未暴露的潜在结果的基于模型的假设,使平行趋势正式化:
假设8(平行的反事实趋势(多时点/渐进)) 对于全部单位和全部时期,未处理和未暴露的结果为

七、讨论

(一)发现
1.只要所有受溢出效应影响的单位都包含在修正后的平行趋势假设下的指标中,带有“邻近”处理单位的方程将消除处理效应估计中的所有偏差。
2.一组同心“环”可以消除所有偏差,改善对溢出效应的估计。
3.在考虑空间溢出效应的设定中,估计会发生显著变化。特别是,基于地点的干预措施改变了当地和周边地区的集聚性质(即造成溢出效应),如果不控制一般均衡效应,这些政策的当地效应会被错误估计。
4.在权衡各种识别策略的利弊时,需要考虑溢出效应的重要性。基于不可观测因素的地理连续性的识别策略将比较组限制在经历了最大的溢出效应的观测上,因此将放大溢出效应带来的偏差。
(二)局限
难以决定在估计中所需的环的宽度和数量。Butts(2021b)的同期工作讨论了在更严格的平行趋势假设下的数据驱动的环形选择,该假设不容易适用于大的地理单位(如县)。
关于空间计量相关问题,参看:1.空间计量经济学最新进展和理论框架2.空间和时间的计量,关注二位国人3.空间计量模型选择、估计、权重、检验4.空间计量百科全书式的使用指南的do file公开5.空间计量百科全书式的使用指南, 只此一份掌握此独门秘籍6.空间计量的46页Notes, 区经相关学者可参阅7.空间计量软件代码资源集锦(Matlab/R/Python/SAS/Stata)8.用R语言做空间计量, 绝不容错过的简明教程9.R软件中的空间计量经济学程序包纵览10.空间计量的研究领域模型, 发展阶段与最新进展11.空间计量和交互项如何使用, 将空间计量进行到底12.JEL上空间经济学综述, 从中可以学到什么?13.空间DID双重差分方法的文献, spatial DID14.中国所有地级市各类空间权重矩阵数据release15.中国省级三大空间权重矩阵(相邻, 距离和经济)数据release16.ArcGIS操作实例视频教程38讲全集17.Arcgis使用通行Textbook推荐, 系统学习的宝库18.Anselin讲解空间计量和GeoDa的运用19.空间计量经济学与操作命令分解20.空间面板数据模型估计数据, 程序和解读,21.空间计量操作的数据和代码面费公开, 尽快下载

关于DID,参看:1.120篇DID双重差分方法的文章合集, 包括代码,程序及解读, 建议收藏!2.空间DID双重差分法运行和操作代码,3.AER未监测的污染, DID和事件研究法运用的典范(附代码),4.AER, 中国大运河上的叛乱: 262年间的证据, 运用DID, CIC, SCM等方法!5.封城的经济代价有多高? 宋铮等用交叠DID, 事件研究法, 结构估计, 引力模型测度,6.诚实双重差分法DID, 面板事件研究法和Bacon分解的经典应用文!7.平衡回归, 面板事件研究法和Bacon分解方法学习与应用前沿案例

关于因果推断书籍:哈佛大学新修订完成的因果推断经典大作免费下载!附数据和code!图灵奖得主Pearl的因果推断新科学, Why?计量课程免费开放!面板数据, 因果推断, 时间序列分析与Stata应用(慕课上有不少免费课程,建议年轻学者好好使用),④你应该阅读哪本因果推断书籍: 一份进阶流程图和简短书评列表


下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

3.5年,计量经济圈近1000篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle




数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 | 官员方言  | 微观数据 | 内部数据计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验计量经济圈组织了一个计量社群,有如下特征:热情互助最多前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存