查看原文
其他

中国女学者与其日本同行在JPE上发文了!利用独特数据, 地理断点RDD和IV研究中国环境议题!

计量经济圈 计量经济圈 2021-10-23

凡是搞计量经济的,都关注这个号了

稿件:econometrics666@126.com

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

Sci-hub最牛逼的英文文献下载网站,可以实时监测最新可用域名

之前,我们引荐过不少关于断点回归设计RDD的文章,里面包括操作数据、程序和解读,列示如下:1.断点回归设计RDD分类与操作案例2.RDD断点回归, Stata程序百科全书式的宝典3.断点回归设计的前沿研究现状, RDD4.断点回归设计什么鬼?且听哈佛客解析5.断点回归和读者的提问解答6.断点回归设计RDD全面讲解, 教育领域用者众多7.没有工具变量、断点和随机冲击,也可以推断归因8.找不到IV, RD和DID该怎么办? 这有一种备选方法9.2卷RDD断点回归使用手册, 含Stata和R软件操作流程10.DID, 合成控制, 匹配, RDD四种方法比较, 适用范围和特征11.安神+克拉克奖得主的RDD论文, 断点回归设计12.伊斯兰政府到底对妇女友不友好?RDD经典文献13.PSM,RDD,Heckman,Panel模型的操作程序14.RDD经典文献, RDD模型有效性稳健性检验15.2019年发表在JDE上的有趣文章, 计量方法最新趋势16.关于(模糊)断点回归设计的100篇精选Articles专辑!17.断点回归设计RDD精辟解释, 保证你一辈子都忘不了18.“RDD女王”获2020年小诺奖!她的RD数据, 程序, GIS和博士论文可下载!关于她学术研究过程的最全采访!19.中国博导要求掌握的RDD方法实证运用范文(配程序code), 不然就不要用RDD做实证研究!20.最近70篇关于中国环境生态的经济学papers合辑!21.事件研究法用于DID的经典文献"环境规制"论文数据和程序22.环境, 能源和资源经济学手册推荐, 经典著作需要反复咀嚼
正文
关于下方文字内容,作者:张左敏暘,英国谢菲尔德大学经济学院,通信邮箱:piggyz@126.com
这篇发表在JPE上的文章使用空气净化器市场的交易数据,再结合空间断点回归设计RDD、各种固定效应和工具变量估计等,系统考察了中国居民对干净空气的支付意愿。

干净空气的支付意愿——来自中国空气净化器市场的证据,原文PDF附在文后

Willingness to Pay for Clean Air: Evidence from Air Purifier Markets in China,” (with Koichiro Ito) Journal of Political Economy, 2020, 128(5).

一. 背景

空气问题是经济发展过程中不可忽视的一环,发达国家也曾经历过先污染后治理的道路,结果是像底特律等工业城市至今难以恢复。上个世纪以来发展中国家经济飞速发展,同样出现了先污染后治理的现象。但是经济的发展要以空气的牺牲为代价带来的成本将由后代承担并且这是难以承受的。近年来,发展中国家不断推出多项空气治理政策去缓解此类问题,那么问题是当下的空气政策是否是最优的呢?应该用什么样的评价标准去评判一项空气政策是否是最优的呢?据此文中给出的回答是计算一个重要的评价参数WTP(willingness to pay),即人们对干净清洁的空气的支付意愿。如果人们的支付意愿较低,那么意味着当下发展经济的收益大于空气污染的成本,此时的空气政策是最优的;反之若是人们愿意为此支付高昂的费用,那么意味着当下的空气问题已经较为严重,此时的空气政策并不是最优的。该文采用中国空气净化器市场的数据去测算WTP。那么为什么采用空气净化器去测算WTP呢?这是由空气净化器产品的一个特性决定的,即高效微粒过滤(HEPA)。这种产品特性吸引着消费者,也就让经济学家可以间接地测度出其价格需求弹性,从而测度WTP。

二. 中国的空气污染、空气净化器市场以及供暖政策

上文提到HEPA的特性使得消费者对此大加青睐,具体而言,中国的厂商都宣传称该过滤特性可以过滤掉99%大于0.3mm的颗粒。这一点与美国能源部门公布的一致。并且确实有研究表明此种空气净化器对提高人的健康,延长寿命有帮助。作者再次强调了选用空气净化器市场估算WTP的优势所在。
自1958年开始,中国以秦岭淮河为界,以此往北在冬季实行集中供暖。由于主要以煤炭为供暖来源,煤炭的不完全燃烧十分低效,这就导致了秦岭淮河以北的地区常年空气质量差。在2003年之前北方集中统一免费供暖,而2003年之后需要付费。但是,南方并没有统一实行集中供暖,而是一直自主决定采用何种取暖方式并自行负担费用。

三. 模型、数据以及实证策略

(一)理论模型

(二)数据说明
作者从以下五个数据源中收集数据集:空气净化器市场数据,空气污染数据,每种产品的制造/进口位置数据,城市统计年鉴中的逐年人口统计信息以及 2005年中国人口普查微观数据。接下来将详细介绍数据情况。
1.空气净化器数据
作者使用市场营销公司从2006年1月至2014年12月在80个城市收集的空气净化器销售交易数据。作者收集到了每月的销售量、每月的平均价格、每个商店的每个产品的产品属性信息。该数据集涵盖了主要百货商店和电器商店的店内交易,它们占所有店内销售的80%以上。在2006年至2014年期间,店内销售占总销售量(包括店内和在线销售)的72%。
由于数据集不能涵盖100%的销售量,因此作者采用两种方法来估算销售量。第一种方法中,作者只是忽略数据集之外的交易。尽管此过程提供了透明度和保守的估计,但它低估了每种产品的销量。在第二种方法中,作者按比例调整销量以解决这个问题。具体来说,将每种产品的销量乘以1.73(= 1 /(0.8 *0.72))。收集的数据中表明45家制造商销售了690种产品,其中包括国内外公司。原始销售和价格数据是产品-商店层级,而在实证分析中污染的外生变化来自城市水平的变化。因此,作者将交易数据汇总到产品-城市层级。这个数据集的独特之处在于作者观察到了详细的每个产品的属性。
2.污染数据
使用2006年至2014年城市级别的平均,来自Ebenstein等(2017)。原始数据来自中国环境年鉴和中国环境质量年度报告。
3.人口统计数据
作者从两个来源收集人口统计数据。首先,从《2006-2014年城市统计年鉴》中获得了有关城市人口和人均GDP的城市年度指标。其次,从2005年人口普查获得个人微观数据。对于每个城市,数据集都包含针对个人随机样本的人口统计变量。作者使用家庭收入数据来创建实证分析中使用的每个城市家庭年收入的实证分布。同时,还汇总了人口普查微观数据,以计算出一套城市级别的社会经济指标,包括平均受教育年限、文盲率、高中毕业率、大学完成率、人均家庭收入、房屋面积(平方米)以及住房质量的衡量标准。
4.GIS数据和地图
作者使用了80个城市作为研究对象,从人口普查数据中获取城市质心的纬度和经度,然后使用ArcGIS将其绘制到中国地图上。图上还展示了淮河/秦岭线的位置,这条线将中国分为北方和南方,见图1。为了进行实证分析,作者根据城市和河流的位置制作了两个距离变量。第一个变量是城市与淮河之间的距离。对于每个城市,使用ArcGIS来测量从城市质心到河边最近点的最短距离。这个距离范围从18英里到1044英里,中位数是303英里。第二个距离变量是从城市质心到工厂或空气净化器进口港口的道路(公路)距离并且使用GIS和Google Maps测量从城市质心到这些位置的最短的道路距离,见图1。
图1
(三)描述性统计
表1显示了净化器的统计信息。在面板A中,第1列中报告所有产品的统计信息,在第2列中报告HEPA净化器,在第3列中报告非HEPA净化器,第四列是他们之间差异的比较及统计显著性检验。尽管产品之间存在很大的异质性,但HEPA和非HEPA净化器之间的均值差异在许多净化器属性(如加湿功能,到工厂或港口的距离以及过滤器更换的频率)的统计差异并不显著。作者观察到这两种净化器在三个变量上有统计意义的显着性差异,这三个变量是:净化器的价格,更换滤清器的价格和房间的覆盖率。在面板B中,以百分比表示相对于家庭数量的销售数量。对于总体销售而言,北京和上海等高收入城市的统计数据更高,暗示经济增长水平可能会影响整体销售。HEPA销售/非HEPA销售比例在淮河以南约为1.2,在淮河以北约为2.0。该统计数据表明淮北地区的消费者与河流南部的消费者相比,北边消费者更有可能使用HEPA净化器。
表1
由于采用的是准自然实验的因果识别方法,因此要求样本具有较高的可比较性。必须对样本容量和样本可比较性进行权衡。因此作者将样本限制在秦岭淮河边界附近而没有扩大到整个中国。以城市与离淮河边界的距离作为断点(cut-off)进行研究。作者采用的是城市级别的微观数据进行实证分析。表2第3栏表明北部和南部之间的样本均值存在显著差异。但是,第4列中的RD估计值表明,在淮河边界的差异统计上并不显著。这就加强了后文因果推断的解释力度。
表2
(四)RD回归的图形直观分析
图2中的(a)散点图显示了2006-2014年间的平均值,横轴是城市与淮河之间的距离。图2中(b)图表明,在河流边界处, HEPA净化器市场份额相对非HEPA净化器的市场份额急剧增加。图中虚线以及实线分别代表回归中一次控制函数以及二次控制函数。图像直观上表明HEPA净化器份额与非HEPA净化器份额的平均差值为0.4个对数点。
图2
(五)正式实证分析
本文的亮点在于计量的因果识别。为了说明本次实证的因果推断难点在于空气污染变量和价格变量均可能为内生变量,这就会导致参数估计的非一致。针对这两个变量可能产生的内生性问题,文章给出了不同的解决思路。针对空气污染变量的内生性,文中选择供暖政策作为外生冲击用空间断点(RD)回归进行处理。这样做的理由一是供暖政策本身是外生冲击,而此外生冲击直接影响空气污染水平进而可以评估空气污染的单向因果关系;二是可以研究人们如何对长期的空气污染变化做出反应。而针对价格的内生性,文中合并了两种办法。在差异化产品的需求估算中,主要的可能的遗漏变量是未观察到的产品质量。品质上乘的产品价格可能很高,因此受到消费者的欢迎,这样价格就可能和不可观测的质量相关,从而与误差项相关。文中采用控制产品固定效应缓解这个问题。另一个被遗漏的变量是城市层面的不可观测的经济因素。如果企业在较高的经济发展水平的城市设置高价格,这也会使得价格和误差项之间相关,作者通过控制城市固定效应来应对此问题。虽然控制两个层面的固定效应可以缓解价格的内生性,但依然存在不可观测的其余因素影响方程的估计。比如在某个城市的产品中价格升高是由于未观察到的需求因素,并且该价格升高仅限于该城市,如果出现这种情况那么产品层面的固定效应以及城市层面的固定效应都不能控制这种混合的状态。为了更好地控制内生性,作者选取了产品的运输距离作为价格的工具变量,其识别假设是运输距离代表产品成本高低,进而影响价格而并不直接影响人们的需求。
实证模型有以下三个:

然而,严谨的解读系数也是因果识别的问题之一。由于多种原因,作者认为估计值可能会是MWTP的下界估计值。首先,中国的家庭可能对空气污染水平以及空气污染对健康的负面影响知之甚少。如Greenstone和Jack(2013)所述,这种不完善的信息可能会使揭示的MWTP偏好估计值低于家庭获得全部信息时将观察到的MWTP的理论水平。其次,作者的方法假设在没有空气净化器的情况下室内空气污染水平等于环境污染水平。最近的工程研究表明,平均而言,室内污染估计可以采取的一种方法是依靠工程对室内外空气污染比的估算,这将使真实的MWTP估计更大。但是,作者报告的是保守的估计。第三,作者的模型假设,如果没有家庭购买HEPA净化器,室内空气污染的减少量为零。很显然,家庭可以采用其他避免方法减少室内空气污染而不一定是购买净化器。例如,家庭可以改善建筑隔热减少传入。第四,作者的模型和实证分析纳入了因替换而产生的运营成本但忽略了电费。根据空气净化器制造商的信息,HEPA净化器的运行成本略高于其他空气净化器。这是另一个原因为什么MWTP估计值可能会被低估。
表3
表4
表5分别是选取不同距离作为断点得到的稳健性检验。作者使用比最佳带宽(400英里)更窄的范围来研究如果使用更靠近淮河的城市的样本RD估计如何变化。结果表明作者的基准回归很稳健(所有结果均包含产品固定效应、城市固定效应、经度四分位数固定效应)。
在基准回归之上,作者还考察了信息冲击对MWTP的影响。
2013年初,中国媒体对空气污染的报道发生了显着变化。在2013年之前,中国媒体很少讨论空气污染及其相关的健康影响。而在2013年1月24日,美国驻北京大使馆发布的空气质量指数(AQI)为755,严重超过空气质量上限500,这次发布引起了人们的重大反应和担忧并促使更多的空气污染报道出现在了报纸上(见图3)。数据显示2006年至2012年所有中国报纸的提及空气污染状况的从平均每个月有158个急剧增加到2013年的1327个和2014年的1549个。类似地,报纸头条的数量提及烟雾的从2006-2012年期间的每年12个跃升至2013年和2014年的每年1000多个。媒体报道的这种突然变化提供了一个有用的实验环境,可以研究信息冲击与MWTP估算之间的关系。作者将数据划分为两个横截面数据集:一个包含2006年至2012年的数据,另一个包含2013年至2014年的数据。作者要测试的是对空气质量的偏好(在基准的模型中)因2013年媒体报道的变化而发生了多大变化。为了检验这一预测,作者汇总了两个数据集并估算了和Post2013之间的交互项的系数。表6中第1列中的基准结果表示对清洁空气的偏爱在2013年后期比2013年之前大,并且两者差异在统计上是显着的。在2013年之前的期间,每年的估计MWTP为0.53美元,在2013年之后的期间为1.44美元。在包含了其余控制变量后结论依然稳健。
图3
表5
基准标准logit模型假设对所有人均同质,而随机系数模型可以放松这个假设估算不同人的。表7第1列采用线性控制函数,第二列采用二次控制函数,结果差异并不大。首先,一年中的减少量(ug / )的中位数和平均MWTP为 1.34,这与标准logit模型获得的MWTP估算值相差不远;其次,家庭收入与对清洁空气的偏好呈正相关;再次,高收入家庭较低收入家庭有更低的价格弹性;最后,显著表明家庭确实存在对清洁空气偏好的异质性。
图4给出了根据表7第1列的估算值的MWTP的分布,表明每年MWTP的分布范围很广,大部分分布在0.49美元(第10个百分点)和2.92美元(第90个百分点)之间,表7同样给出了其他分位数的估计。图5显示了MWTP与家庭收入之间的关系。作者给出了收入水平在95%的置信区间下的MWTP估计的拟合线。这表明收入较高家庭愿意为改善空气质量付出更多。
表6
表7
图4
图5
文章所要回答的核心问题的到此便结束了,但作者还做了额外的探索。

四. 政策含义

由以上模型可以估计出边际支付意愿MWTP,随机系数模型可以考虑异质性问题并估计出一个异质性MWTP,但由于实证策略是断点回归,因此在没有额外的假设之下并不具备外推可能,所得的只能是局部平均处理效应LATE(local average treatment effect),这一点对于政策制定者要尤为关注。除此之外,作者还额外做了政策的成本收益分析(cost-benefit analysis),但并不是本文的重点。

五. 总结

回顾本篇论文的核心内容,作者的研究目的是想测算人们愿意为消除污染而支付多少。在计量上的实证难点即是尽可能地降低核心变量的内生性。在方法主要包括了控制各个层面的固定效应、寻找工具变量以及采用空间RD回归。将不同的解决内生性的方法结合了起来得到的结论更为干净,尽可能地排除了不可观测因素以及其余变量的干扰。没有一项研究是完美的,研究所能做的工作只有尽量地严谨不断逼近真实的因果。作者在附录里面更进一步地讨论了还可能存在的因果识别问题。1.由于空气污染导致的家庭自选择。北部的家庭可能迁移到南部以寻求更清洁的空气,作者用户口制度排除了这一可能。2.断点的设置问题。如果并不是以秦岭淮河为界那么结论就可能出现问题。3.担心淮河政策可能由于与空气污染无关的原因影响净化器的购买。4.工具变量的选择问题。一个好的工具变量十分难得,作者为了使结论更可信,除正文部分还额外加了其余工具变量进行稳健性检验(具体见附录)。作者在文章最后同样也指出了自身研究的局限以及未来可能的方向。
在科罗拉多大学执教的张爽助理教授的发表情况(2012年康奈尔大学博士毕业):

长按以上二维码可以阅读原文PDF

有些学术神器,推荐给各位:找合适的英文期刊发表的神器! 亲测太好用了!神器! SSCI分区及影响因子查询, 还有国人发表比例,③学术神器Endnote的最详尽使用方法,④一数学神器诞生! 手写公式和符号, 竟免费转成LaTex,⑤让LaTeX排版流行起来, 让效率助你奔跑助你飞

拓展性阅读:①"实证研究13篇"功夫秘笈, 中青年学者研究必备锦囊!关于各种因果识别方法的120份经典实证文献汇总”,②哈佛大学新修订完成的因果推断经典大作免费下载!附数据和code,③因果推断的统计方法总结, 177份文献政策评估的计量方法综述, 包括最新因果推断方法在教育领域使用IV, RDD, DID, PSM多吗? 使用具体文献,⑥看完顶级期刊文章后, 整理了内生性处理小册子,⑤工具变量精辟解释, 保证你一辈子都忘不了,⑦DID, 合成控制, 匹配, RDD四种方法比较, 适用范围和特征,⑧关于双重差分法DID的32篇精选Articles专辑!关于(模糊)断点回归设计的100篇精选Articles专辑!匹配方法(matching)操作指南, 值得收藏的16篇文章等,⑪MIT广为流传的政策"处理效应"读本,⑫DID的研究动态和政策评估中应用的文献综述,⑬最新政策效应评估的四种方法,⑭政策效应评估的基本问题

下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

2.5年,计量经济圈近1000篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle




数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 | 官员方言  | 微观数据 | 内部数据计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验计量经济圈组织了一个计量社群,有如下特征:热情互助最多前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。

: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存