查看原文
其他

平衡回归, 面板事件研究法和Bacon分解方法学习与应用前沿案例

计量经济圈 计量经济圈 2022-10-02

凡是搞计量经济的,都关注这个号了

箱:econometrics666@126.com

所有计量经济圈方法论丛的code文件, 微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

关于Bacon分解,可以参看:1.一篇使用Bacon分解作为交错DID稳健性检验的TOP文章, 数据和代码分享!2.“交错(渐进)DID中, 用TWFE估计处理效应的问题, 及Bacon分解识别估计偏误”, 3.诚实双重差分法DID, 面板事件研究法和Bacon分解的经典应用文!(提供了代码和数据的)

正文

关于下方文字内容,作者:周宁哲, 武汉大学经济与管理学院,通信邮箱:inze_zhou@foxmail.com
作者之前的文章:1.Top金融,经济与会计期刊中的文本分析, 一项长达2万字的综述性调查,2.前沿: 解决内生性问题的无工具变量推断法,3.断点回归设计RDD的原理和实证指南, 年龄, 地理, 分数等断点应有尽有,4.AER, 中国大运河上的叛乱: 262年间的证据, 运用DID, CIC, SCM等方法!5.诚实双重差分法DID, 面板事件研究法和Bacon分解的经典应用文!
低排放区与人口健康(文后二维码可以下载原文PDF)
Shushanik Margaryan, 2021, Low emission zones and population health, Journal of Health Economics
Air pollution has a detrimental impact on population health, but the effectiveness of policy measures targeting pollution is underexplored. I exploit the natural experiment generated by the staggered implementation of low emission zones in large cities across Germany to assess their impact on health. Using register data on outpatient and inpatient health care, I find that low emission zones reduce the number of patients with cardiovascular disease by 2–3%. This effect is particularly pronounced for those over the age of 65. The findings suggest that low emission zones can be an effective way to reduce air pollution and improve health.
摘要
空气污染对人口健康有不利影响,但针对污染的政策措施的有效性尚未得到充分探索。我利用德国大城市交错实施低排放区所产生的自然实验来评估它们对健康的影响。使用门诊和住院医疗保健登记数据,发现低排放区将心血管疾病患者的数量减少了 2-3%。这种影响对于 65 岁以上的人尤其明显。研究结果表明,低排放区可以成为减少空气污染和改善健康的有效方法。

一、 引言

交通带来了一座城市四分之一以上的空气污染。尽管人们对交通影响污染给予了相当大程度的关注,但对其在改善人口健康方面的效果仍然没有充分探讨。
文章研究了低排放区(low emission zones, LEZs)对空气污染和心血管健康的影响。低排放区是某些根据其排放等级规定限制汽车进入的区域。自2007年以来,欧洲多个城市,已经逐渐引入这种政策。其中,德国低排放区的限制性最强,几乎做到全年内24小时禁行,且囊括几乎所有类型的车辆。德国的低排放区分三个阶段推行,这提供了值得研究的“自然实验”结果。
研究利用德国城市引入低排放区时的跨时空变化,构造DID模型。空气污染领域,重点关注两种标准污染物:空气动力学直径小于10的颗粒物(PM10)和二氧化氮(NO2)。居民健康则使用主要德国法定健康保险系统中的门诊数据。
研究发现LEZs将月度PM10浓度降低了2-3%,NO2浓度则降幅较小;进一步研究表明,低排放区影响空气质量的一个可能的渠道是通过减少被处理城市中排放量最大的汽车所占份额。通过改善空气质量,低排放区也改善了人口健康。基于门诊数据的研究结果表明,心血管疾病患者的数量减少了2-3%,且对65岁以上老者的心血管疾病影响较大(7-12.6%)。事件研究图显示,健康结果的变化与PM10的变化大致平行。同时,经检验,与控制区相比,低排放区的社会经济特征并没有随着时间的推移而发生系统性的变化。
文章贡献有以下几个方面:①针对空气污染的政策工具带来对公民带来的健康影响研究较少,本文填充起这部分文献。类似的研究主要有Pestel & Wozny (2019)。②对于污染引致的健康问题,现有文献多关注婴幼儿,本文将全年龄段人口,尤其是老年人口纳入分析,丰富了相关领域文献。③大多数评估空气污染对健康影响的研究都使用短期内(天或周)的污染变化数据,本文提供中长期中的分析,能够追踪到政策出台后的八年内评估健康影响,补充了现有研究。

二、 低排放区(LEZs)

欧盟清洁空气指令(EU Clean Air Directives)是全世界最严格的空气质量标准之一。其中,指令1999/30/EC规定了标准污染物的数值限制值和警报阈值。它将对PM10的治理分为2005-2009年和2010年以后两个阶段,分别规定了一系列排放浓度的阈值。
据估计,在2005年至2007年期间,德国有79个城市违反了PM10的每日阈值,其中12个城市更是违反了年度阈值。欧盟可以对违反规定的城市进行重大的经济处罚。
因此,德国政府规定,只要有一个污染监测站违反了阈值,城市就必须制定一个清洁空气行动计划(Clean Air Action plans)。清洁空气行动计划包括四个主要内容:扩大公共交通,发展环城公路(utilizing ring roads),改善交通流量,以及,推行低排放区。
低排放区(LEZs)分阶段实施,且限制越来越严格。限制车辆的标准根据欧盟内尾气排放标准而定,其将乘用车分为欧1(Euro 1)到欧6这几类。排放最高的类别,欧1类型车,将无标识徽章,而其他几类都会被派发带彩色编码的徽章。
LEZs的第一阶段只禁止没有徽章的车辆进入(欧1);第二阶段额外禁止有红色徽章的车辆(欧2);第三阶段进一步限制有黄色徽章的车辆(欧3)进入。欧4到欧6类别的汽车获得绿色徽章,并不被限制(柴油车单独受到柴油车禁令(Diesel bans),除柴油车中的欧6,其余车型都禁止入内)。

上图描绘了各城市实施三阶段LEZs的时间。但并非所有实施低排放区的城市都是排污不达标城市,反之亦然,一些不达标城市尚没有低排放区。下图则刻画样本构成及其时空变化:

由于LEZs由各个城市自己设计,因此其占城市总面积比例大小有很大差异。此外,有证据表明,LEZs的居民平均收入比城市其他地区略低、每户的汽车数量较少、65岁以上的居民较少、人口密度较高。
对于LEZs之于环境的效果,已有研究发现,其有助于PM10和NO2浓度下降,但对于婴儿健康的影响并不明显。由于大众等汽车企业的丑闻(人为操纵伪造排放量)发生在样本期间,文章研究所报告的LEZs对于空气污染的影响很可能被部分低估。

三、 数据

①2004-2016年期间的每日PM10和NO2测量数据,来自德国69座城市的264个PM10监测站和261个NO2监测站。
②德国气象局(DWD)的天气数据,包含每日温度、风速、降水、云层、水汽、气压和相对湿度等信息。
③2009-2017年期间德国流动卫生保健中心研究所(Institute of Ambulatory Health Care)的问诊病人数据。研究获得了不同区域具有相关诊断的患者数量(年层面)。由于数据保密性与样本期时长等问题,额外使用联邦统计局(Federal Statistical Office)的医院诊断统计作为补充。
下表展示了部分描述性统计结果,经由简单分析发现,污染指标在处理组与控制组间确实存在显著差异。

四、 低排放区政策之于空气污染与行车组成

(一) 空气污染

为了评估低排放区对污染的影响,文章估计以下方程式:

上表报告了估计结果,可见相对于LEZ实施前的平均浓度水平,低排放区内每月PM10浓度表现出下降趋势,而对NO2的结果则存在统计学显著性上的问题。
注意,表中第(3)、(6)列讨论了潜在溢出效应,即,如果高排放车辆车主为避开低排放区而绕路,其途径的监测站可能会受到负面溢出效应,或者如果低排放区的出现导致整座城市的车辆组成改变或汽车使用量下降,则会产生正面的污染溢出效应。参数“Station restrictions”通过排除位于被处理城市但在低排放区之外的所有污染监测站谈论这一问题。结果显示,两个方向的溢出效应都可以忽略不计。
此外,由于数据等原因,文章并未主要讨论PM2.5,原文附录中报告了对PM2.5的补充分析,其结果同样出现下降趋势。
为识别低排放区对污染的动态影响,文章估计了如下事件研究模型:

其中,基组设置为-1期,即,时间效果是相对于LEZ实施前一年而言的。下图报告估计结果。结果表明,平行趋势假设很可能成立。且从第三年开始,污染水平的下降显著强于基期。

(二) 行车组成(car fleet composition)

低排放区可能通过多种渠道影响空气质量。短期内,低排放区可能会减少道路上汽车的绝对数量。在从中长期,排放高的汽车可能被更清洁的汽车所取代,汽车数量也会回升。
文章利用德国联邦汽车运输管理局(Federal Motor Transport Authority)的数据,对不同排放等级的汽车注册数量进行研究。下表报告了结果,结果表明,低排放区减少了欧1汽车的份额,并增加了欧4汽车在受处理城市的份额,且欧1汽车的最大幅减少发生在LEZ实施的第二阶段和第三阶段,欧4份额在第三阶段增加最大。

五、 低排放区政策之于心血管健康

(一) 主要结果

为估计对居民健康的影响,文章估计以下范式:

上表列出了对心血管疾病的主要影响结果。奇数列是全样本估计值;偶数列是限制性样本的估计(由于09年前医疗数据有缺失)。可见,在限制样本后,所有年龄段心血管疾病患者人数在处理后减少了2.2%,即每万人每年减少0.9名患者;对65岁以上老年人的患病数量减少约2-3%。此外,文章还讨论了心血管疾病中的两类:心脏病(heart disease)和脑血管疾病(cerebrovascular disease),结果与前述类似。
分年龄段的估计如下图:

该图显示,全年龄段的所有心血管疾病诊断数都在减少,老年患者的减少量确实最大。此外,老年人的心脏病有所改善,而中年人的脑血管疾病也有所改善。
原文附录中还进行了一项逆向成本效益分析,证明了心血管疾病患者人数减少所产生的正效益超过了发车辆升级产生的成本。

(二) 事件研究与Goodman-Bacon分解

考虑影响的动态变化,估计如下事件研究模型:

估计结果如下图:

该图表明,在低排放区实施后,受处理城市病患数量下降更快,且低排放区实施的时间越长,其效用就越大。
然而,对于多期DID模型,Goodman-Bacon(2018)表明,每期受冲击单位都可能在某个时段作为控制组。因此,随着时间的推移,渐增的处理效果可能使差分估计系数被低估。下图展示了分解结果:

估计结果68%的变化来自于处理组与从未从未组间的比较(treatment versus never treated);时间组相互影响带来的干扰较小(earlier group treatment versus later group control和later group treatment versus earlier group control权重都不高);而处理组与进入样本时已受处理的组的比较(Treatment vs. Already Treated)带来不可忽视权重(23.6%),这证实了前文的担忧。
处理这一问题的一个直接思路是删去在进入样本前已实施LEZ的城市,即采信于基准结果偶数列中的“限制性样本估计(Intro after 2009)”。

(三) LEZ对污染与健康影响的时间分布

下图绘制了限制性样本中PM10、NO2和心血管疾病的事件动态。该图表明,PM10和心血管疾病在低排放区实施的那一年就已经有所反应,这是符合实际的。此前也有研究表明,空气污染对健康的影响在短期和长期内都可以观察到。

正如前述,LEZ政策的实施包括几个阶段。这些阶段可能会影响污染物的浓度,从而影响不同的健康结果。下图展示了不同阶段分离后的影响,其能够佐证对健康的影响具有累积性作用。

(四) 健康影响的进一步探究

流行病学和经济学文献表明,呼吸系统疾病、糖尿病和中枢神经系统疾病也经常与空气污染有关。在原文附录中,作者考虑了这三类疾病受LEZ的影响,几乎没有证明支持其统计显著性,这可能与德国已经实施的针对这些疾病的特殊管理计划有关。

(五) 其他结果

文章还使用住院病人数据来弥补门诊数据样本期长度的不足。结果如下图所示,所有的估计系数都表明心血管疾病的入院人数减少了,但都不足够显著。
这可能是由于数据中没有包含关于个人是否居住在低排放区的信息;以及住院往往和较严重病症挂钩。

六、 稳健性检验

(一) 平衡回归(Balancing regressions)

对识别结果的一个潜在威胁是,LEZ的实施可能与同时影响污染和健康结果的社会经济变化相关。对此,文章对受处理地区的社会经济特征上的变化进行识别。
首先使用城市层面的人均工业产出、失业率、人均GDP、卫生和其他服务产出以及人口密度数据作为因变量。下表中A组显示相应结果,各系数均不显著。在B组中,文章使用使用RWIGEO-GRID数据集公布的家庭的购买力,人口密度,30-65岁和65岁以上的成年人的比例等变量以及RWI-GEO-RED公布的公寓月租金价格。同样没有证据表明家庭收入、年龄构成、人口密度和租金价格在低排放区内部有系统性变化。

(二) 控制组的设定

前文分析中,常将整座城市作为LEZs的控制组,这可能会导致有偏估计。
对此,文章在未实施LEZ政策的城市中生成虚拟的LEZ,生成细节见原文附录B。进而,使用包括真实的和虚拟的LEZ的数据进行回归,结果表明前文测度的结果并非由LEZ所在区域的系统性不同造成。

(三) 模型设定问题

另一个问题是,LEZ常为一城市应对污染问题的最后手段,这意味着这些城市在LEZ之前已颁布了各种反污染政策。对此,文章尝试①仅使用实施过LEZ政策的城市样本;②在控制变量组中加入清洁空气行动计划的指标变量。此处结果与主要结果相当。

(四) 更换因变量

上表还显示了跟换因变量后的影响,其中第(3)列采用病例数(而非病人数)作为因变量,第(4)列则使用患病率(prevalence rates),结果仍可信。

(五) 安慰剂检验

上表的最后一板块展示安慰剂结果。第(5)列使用受伤病人的数量作为因变量;第(6)列中,为所有受处理城市随机生成低排放区的颁布时间;第(7)列仅使用前文假设的虚拟LEZs。三种方式的估计系数均小而不显著。

(六) 数据汇总到城市层面

最后,文章在城市层面上汇总观察结果,这有助于研究LEZ对心血管健康的改善是否存在区划意义上的界限。下表详细报告这一思路,其中A组直接将患病人数聚合到城市一级,而后沿用基准回归的方法,结果并不显著;B组则将虚拟变量“LEZ”更换为“LEZ size”,即LEZ在整个城市面积中的百分比,点估计表明,当该区的相对规模增加10个百分点时,在受处理的城市中,整个人口的心血管疾病患者的数量减少了5%,65岁以上的人减少了8%;C组将因变量换为病患人数密度,结果与B组类似。

七、 结论

文章评估了德国低排放区对政策的实施居民健康的影响。实证研究结果具有强烈的政策含义。
结果表明,低排放区是减少城市地区空气污染和改善通常与空气污染有关的健康结果的一个有用工具。成本效益分析显示,近44.3亿欧元的健康效益是以23亿欧元的车辆升级为代价的。然而,由于该政策主要针对高排放的汽车,而这些汽车往往是旧的且便宜的,低排放区的实际负担很可能落在社会经济背景低的家庭和小企业身上。
同时,自低排放区引入以来,行车组成已经发生了巨大的变化。在2019年,获得绿色徽章的汽车份额超过90%(这实际上是对低排放区影响的逐步削弱)。最后,文章分析表明,空气质量的改善虽然有意义,但还不足以解决健康问题,对城市而言,更严格的政策或许仍有必要。

关于DID,参看:1.120篇DID双重差分方法的文章合集, 包括代码,程序及解读, 建议收藏!2.空间DID双重差分法运行和操作代码,3.AER未监测的污染, DID和事件研究法运用的典范(附代码),4.AER, 中国大运河上的叛乱: 262年间的证据, 运用DID, CIC, SCM等方法!5.封城的经济代价有多高? 宋铮等用交叠DID, 事件研究法, 结构估计, 引力模型测度,6.QJE: 离婚越容易, 女性生活越幸福!DID证实!

长按以上小程序即可下载原文PDF

关于因果推断书籍:哈佛大学新修订完成的因果推断经典大作免费下载!附数据和code!图灵奖得主Pearl的因果推断新科学, Why?计量课程免费开放!面板数据, 因果推断, 时间序列分析与Stata应用(慕课上有不少免费课程,建议年轻学者好好使用),④你应该阅读哪本因果推断书籍: 一份进阶流程图和简短书评列表


下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

3.5年,计量经济圈近1000篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle




数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 | 官员方言  | 微观数据 | 内部数据计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验计量经济圈组织了一个计量社群,有如下特征:热情互助最多前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存