查看原文
其他

用事件研究法进行因果识别如何做? 有什么好处? 与DID结合起来潜力无穷!

计量经济圈 计量经济圈 2021-10-23

凡是搞计量经济的,都关注这个号了

稿件:econometrics666@126.com

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

正文
关于下方文字内容,作者:张左敏暘,英国谢菲尔德大学经济学院,通信邮箱:piggyz@126.com
作者之前的文章:中国女学者与其日本同行在JPE上发文了!利用独特数据, 地理断点RDD和IV研究中国环境议题!
事件研究法用于DID的经典文献"环境规制"论文数据和程序

原文PDF附在文后.

Dobkin, Carlos, Amy Finkelstein, Raymond Kluender, and Matthew J. Notowidigdo. 2018. "The Economic Consequences of Hospital Admissions." American Economic Review, 108 (2): 308-52.

We use an event study approach to examine the economic consequences of hospital admissions for adults in two datasets: survey data from the Health and Retirement Study, and hospitalization data linked to credit reports. For non-elderly adults with health insurance, hospital admissions increase out-of-pocket medical spending, unpaid medical bills, and bankruptcy, and reduce earnings, income, access to credit, and consumer borrowing. The earnings decline is substantial compared to the out-of-pocket spending increase, and is minimally insured prior to age-eligibility for Social Security Retirement Income. Relative to the insured non-elderly, the uninsured non-elderly experience much larger increases in unpaid medical bills and bankruptcy rates following a hospital admission. Hospital admissions trigger fewer than 5 percent of all bankruptcies in our sample.
一.背景介绍众所周知,美国的医疗系统在全球都是顶尖的,但是费用也是高昂的。在美国,健康冲击是美国成年人经济风险的主要来源。防范此类风险一直是美国健康保险政策的主要动因。但是从现有文献来看,我们缺少对住院带来的经济后果的研究。因此,本文将研究这一问题。二.理论分析作者建立了一个简单的理论模型,在该模型中,健康冲击可能会导致自付费用的医疗费用增加和收入减少(详见原文第二部分以及附录推导)。三.数据以及实证(一)数据说明作者以模型中“不利的健康冲击”来分析住院的经济影响。之所以选择住院这样的冲击是因为入院的费用昂贵、可衡量,并且几乎无法预料。作者使用了两套互补的数据进行研究。分析了从1992年到2012年的11次双年度调查的健康与退休研究(HRS),这是一项针对美国老年人和即将步入老年的人的全国代表性调查。作者还分析了2003年至2007年间从加利福尼亚医院出院的个人样本,并将其与2002-2011年1月份的信用报告相关联。并将这些人联系起来并收集有关2000年至2010年期间其在加利福尼亚州所有住院情况的信息,以及收集了来自加利福尼亚生命统计数据(截至2010年)的死亡率数据(住院和出院)。在这两个数据集中,作者限制健康“冲击”在最近没有住院的个人,并将孕妇排除在外。并保证用于分析的调查样本中的人至少是在近三年内首次住院。作者关注的重点是有保险的非老年人样本。在HRS中,来自非老年人样本住院的个体年龄为50-59,在信用报告分析的样本中年龄为25-64。如果HRS中的某人在报告有私人保险或医疗补助,则将其定义为“已保险”。在加利福尼亚州的出院数据中,如果被调查样本付款的时候是私人保险或医疗补助,则将其定义为“已保险”。在这两个数据集中,作者都排除了大约15%的样本,这些排除的样本中大多数是残疾人,因其已经遭受了不利冲击,因此不符合本次研究。最终,基准样本包括HRS调查中住院期间约2,700名50-59岁的受保成年人和信用报告数据中380,000名25-64岁的受保成年人。在基准样本之外,作者通过对比的其他人群来补充分析。在HRS中,作者分析了大约1600名入院时年龄在60-64岁之间的有健康保险的非老年人样本。此外,作者还报告了一组针对老年人(65岁及65岁以上)的分析,研究的是HRS中的约5800名样本和信用报告数据中的约400000名样本。最后,在信用报告数据中,作者分析了约15万没有医疗保险的非老年成年人,这些人在入院时是25-64岁且其是自费医疗。
表1
表1是两份数据样本的描述性统计分析。表1第一栏HRS的数据显示平均入院年龄是56岁,而第2栏信用报告的数据显示平均入院年龄在49岁。通过关联与第2列中的信用报告样本相关的加利福尼亚出院数据,还可以知道,有85%的住院医疗费用是由私人保险支付的,四分之三的人住的是非营利性的医院以及大约有一半人通过急诊室入院。数据显示住院期平均为4天,并产生约46000美元的清单费用。此外,约五分之一的人在12个月内再次入院,36%的人在48个月内重新入院(更多细节详情参看线上附录)。关于关键关注变量,作者使用HRS分析入院的医疗支出(Out-of-Pocket Medical Expenses),收入(Earnings)、总收入(Income)以及潜在的收入保险(Earnings Insurance)来源,特别是配偶收入和社会保险计划。作者采用CPI指数来将所有美元金额调整为以2005年为基准的水平,并在第99.95个百分位数处进行缩尾处理。作者使用信用报告数据来分析模型中其余的关键变量:未付医疗费(Unpaid Bills),借款(Borrowing),借款限额(Borrowing Limits)和借款费用(Interest Rate)。需要注意的是所有变量都是存量,是针对个人而不是家庭。和HRS数据处理一样,再次缩尾了第99.95个百分位数的极端异常数据。其中未付费用作者考虑了给收款机构的“迄今为止的收款数量(Collections to Date)”(从2002年开始)和当前的未付收款余额(Current Unpaid Collection Balances)。至于借款,主要衡量指标为信用卡余额(Credit Card Balance)和汽车分期付款贷款(Automobile Installment Loans)。作者根据所有未结周转账户中个人的总信用额度来代替总借款额度和使用个人的信用评分(Credit Score)来代表个人可获得的利率近似借款费用。(二)计量实证本文的因果识别计量模型是事件研究法(Event Study)。作者同时估计非参数和参数事件研究模型。1.非参数模型设定非参数事件研究的主要优势在于能够直观地观察相对于住院日期的主要关注变量的变化结果。设置如下:
其中是日历时间固定效应的系数,表示其他潜在的控制变量,是相对于住院时,时间指标上的系数。最感兴趣的关键系数是,在给定r下,该估计结果解读为相对于省略的的结果大小。 1.1 HRS样本模型设定在HRS半年一次调查的样本中,事件r定义为相对于调查时报告入院r=0的期数,然而实际入院时间平均在r=0的前一年,因此实际上入院时间是r=-1。作者选取了在0期前三期以及后三期作为事件窗口研究事件的影响。 1.2 信用数据样本模型设定作者将事件时间r定义为相对于入院(r=0)的月数。选取前47个月以及后72个月作为事件研究窗口进行研究。 1.3 因果识别假设为了正确解读模型中估计的系数含义,需要做出额外的识别假设。在观察窗口和控制了其余控制变量外,入院的时间与被解释变量无关。除此之外,在健康恶化之前进行的入院,或因失业造成的健康冲击而入院,均会违反该假设而导致因果推断失效。2.参数模型设定作者使用参数事件研究来总结估计效果的大小及其统计意义并对函数的选择形式由非参数事件研究中的呈现出来的形式作为设定指导。 2.1 HRS样本模型设定
其中r表示控制线性趋势,最值得关注的参数是,它反应了相对于线性趋势被解释变量变化量的大小。 2.2 信用报告样本设定除和非参数设定一样设定外,作者在这部分对入院后的事件期额外施加了三次方函数的约束。
该设定允许事件发生后与被解释变量之间存在的二阶和三阶导数关系,事件发生后12个月(r>12)和事件发生后24个月(r> 24)的三阶导数发生变化。感兴趣的关键系数到总结了入院后相对于任何先前存在的线性趋势(β1)的变化。
3.HRS实证结果
3.1 入院对自付医疗支出以及收入的影响
图1
图1显示了入院时年龄在50-59岁的有保险的非老年人的住院对HRS中自付费用,就业,收入,配偶收入,政府转移支付和家庭总收入的影响。对于每个结果,作者根据非参数事件研究回归绘制事件时间的估计系数,并根据参数事件研究回归绘制被解释变量与事件时间之间的估计的入院前的线性关系。其中实心点代表非参数估计的结果,空心点代表95%的置信区间,实线代表参数模型拟合的线性趋势。为了更好地解读,作者计算了事件期后隐含的效应大小。见表2(具体计算推导详见网上附录)。
表二
住院对自付费用和工资的影响直观上在住院后马上显现并持续存在。在随后的几年中,线性趋势拟合医院入院前的趋势效果很好,大概反映了以下事实:健康冲击是50-59岁被保险成年人医疗费用和劳动力市场活动特质变化的主要原因之一。入院后三年内,每年住院的平均自付费用增加$ 1,429(标准误为$202)。毫不奇怪,第一年对自付费用的影响更大。入院后第一年的自付费用($3,275,标准误为$ 373)是入院后第三年的自付费用($1,011,标准误为$371)的三倍。入院后几年对自付费用的影响继续具有统计学上显着的影响(尽管数值较小)。这可能反映出入院与未来医疗费用的增加有关。入院后第一年被雇佣概率降低了8.9个百分点(标准误为1.8),入院后第三年降低了11.1个百分点(标准误为2.3)。这代表与入院前的平均水平相比,就业可能性下降了12-15%。该点估计值表明,与入院相关的年收入的下降幅度随着时间的推移而增加,从第第一年的$ 6,445(标准误为$ 4,024)开始,到入院后第三年的$ 11,071(标准误为$ 3,475)。在入院后的三年中,平均年收入下降了8,753美元(标准误为3,415美元);相对于入院前的平均水平,这意味着收入下降了约20%(更多详情参看网上附录)。 3.2 入院对收入保险的影响作者考虑了两种收入保险,一种是非正式的配偶的劳动供给,另一种是正式的社会保险。没有统计或实质性证据表明配偶收入有反应,但有证据表明入院后三年平均每年向家庭支付的社会保险金增加881美元(标准误为338美元)。 3.3 异质性分析作者还考虑了入院时年龄在60-64岁之间的人以及入院时年龄在65岁以上的人(“老年人”)。
表三
表3展示了参数模型的估计计算结果,而图2直观地绘制了这些结果。入院前的雇佣率随着年龄的增长而下降:在基线样本中为74%,而60-64岁的老年人为55%,65岁以上的老年人为11%。住院对这三个年龄段的人的自付费用的影响都相似,尽管对于老年人来说稍小。60-64岁的人和50-59岁的人的收入和就业下降也大致相似。60-64岁年龄段的就业机会下降幅度稍大,而收入下降相比较而言较小,尽管两个群体之间的差异在统计上均不显着,但它们共同表明,与50-59岁的人群相比,大幅度雇佣率的下降在解释60-64岁的人群的收入下降方面可能更为重要。对于老年人,研究发现住院对收入或社会保险金都没有影响。综上所述,这些结果表明,住院治疗对入院时正在工作的人的就业和收入产生重要影响。 3.4 稳健性检验
表4
表4(续)
表4第1列出了基准回归计算结果。随后的所有列均表示不同假设的回归计算结果,比如采用何种模型设定,是否有不同的控制变量等。表4第2列包括个人虚拟变量和调查时间的固定效应;第3列重新估计了基准模型,将样本限制为平衡面板,期数在在-2至2之间;第4列仅包含调查期数的固定效应;第5列增加了年龄的立方项,男性虚拟变量,种族虚拟变量和教育虚拟变量与群组固定效应;第6列重新估算了扩展样本的基准回归,将样本并不限于进行入院前调查;第7列重新估算了基准回归,采用泊松回归,而不是线性回归。结果均表明基准回归具有较强稳健性,因果推断合理。4.信用报告样本实证结果
图3
图4
图3和图4直观显示了信用报告数据中入院时年龄在25-64岁的被保险成年人住院对迄今为止的收款数量,信用额度,信用卡借贷和汽车贷款的影响。
图5
图5中的面板A显示了该相同人群对破产率的影响。再次,根据非参数事件研究回归绘制事件时间的估计系数,以及根据参数事件研究回归的结果与事件时间之间的估计入院前的线性关系。表5和表6(面板A)汇总了入院后一年和四年的影响。 4.1 未付费用及破产影响
表5
表6
表5和表6说明住院对收款(数量和余额)有明显的影响。四年后,入院导致总收款余额增加302美元(标准误为37美元),相对于入院前余额增加了约25%。入院对医疗的收款数量的影响最初随着时间的推移而增加,然后大约两年后变得平缓。统计上,住院也与消费者破产增加显著相关。四年后,入院与破产概率增加0.4个百分点,相对于该人群中1.2%的年破产率,大约增加了33%。
4.2 借款及信贷可得性的影响
四年后,入院带来的影响是信用卡余额减少了1,208美元(标准误为253美元),大约10%。入院后的四年内,汽车贷款余额也下降了507美元(标准误为71美元),降幅约为7%。总的来说,三种形式的借款额度下降都与在HRS数据中估计住院之后的未来收入持续下降相一致。此外,入院还与信贷机会下降有关。入院四年后,信贷额度下降了2,215美元(标准误为440美元),相对于入院前水平下降了约5.5%。信用评分下降了1.8(标准误为 0.5)或约0.2%。
4.3 替代样本:老年人和未投保的非老年人
作者针对老年人和未投保的非老年人入院者进行了额外分析。表5和表6的面板B和面板C展示了中参数事件研究中的计算结果。
对于老年人,尽管健康冲击的严重程度(以住院天数或住院时间来衡量)较大(详情请参见在线附录),但结果表明与投保的非老年人相比,健康冲击对收支结果的影响较小,特别是,没有证据表明对破产或信用额度有影响。没有证据表明信用卡借贷有所减少也没有弱证据表明汽车贷款有所增加。入院后信用评分下降,其幅度与投保的非老年人有所相似。
对于没有保险的非老年人,作者发现对收款和破产的影响比对有保险的非老年人的影响更大,但对信用卡余额,汽车余额和信用额度的影响却相似(或更小)。例如,四年后,未保险人的未付费用为$ 6,199(标准误为$ 130),而被保险人为$ 302(标准误为 $ 37)。此外,未保险者的右尾效应也更大,破产对未保险者的影响也更大。没有保险的人在医院住院,四年内破产率增加1.4个百分点(标准误为0.14),而被保险人的破产率增加0.4个百分点,与入院前的年度破产率相似,约为1.2%(其他详见线上附录)。
4.4 稳健性检验
表7
表7列出了针对非受保老人的参数事件研究的许多替代模型的计算结果。其中第1列是基准回归结果;第2列包含了个体固定效应;第3列分析限于住院前两年和住院后四年内没有缺失数据的平衡面板;第4列将样本限制为根据年龄和诊断认为处于最低死亡率的人群样本;第5列将最近三年内曾入院的被保险人增加到基准样本中。此外,事件研究假设,入院者不会预期何时入院或他们无法自行决定何时住院,在这样的假设下,健康冲击才能推断经济因果。因此,作者认为他们收集的医院出院数据中的详细信息使他们可以探讨潜在的敏感性分析。第6列将样本限制为通过急诊室入院;第7列限制为不可延期入院样本;第8列不包括“非卧床护理敏感病”的入院样本(更详细参考线上附录)。结果表明基准回归因果推断有效。
四.结果含义
作者在模型估计结果的基础上讨论了诸如保险、医疗、福利等含义(详见原文第4部分)。
五.结论
本文主要探讨的是健康冲击住院带来的经济影响,采用非参数以及参数模型的事件研究法来估计外生冲击带来的影响。

长按以上二维码可以阅读原文PDF

有些学术神器,推荐给各位:找合适的英文期刊发表的神器! 亲测太好用了!神器! SSCI分区及影响因子查询, 还有国人发表比例,③学术神器Endnote的最详尽使用方法,④一数学神器诞生! 手写公式和符号, 竟免费转成LaTex,⑤让LaTeX排版流行起来, 让效率助你奔跑助你飞

拓展性阅读:①"实证研究13篇"功夫秘笈, 中青年学者研究必备锦囊!关于各种因果识别方法的120份经典实证文献汇总”,②哈佛大学新修订完成的因果推断经典大作免费下载!附数据和code,③因果推断的统计方法总结, 177份文献政策评估的计量方法综述, 包括最新因果推断方法在教育领域使用IV, RDD, DID, PSM多吗? 使用具体文献,⑥看完顶级期刊文章后, 整理了内生性处理小册子,⑤工具变量精辟解释, 保证你一辈子都忘不了,⑦DID, 合成控制, 匹配, RDD四种方法比较, 适用范围和特征,⑧关于双重差分法DID的32篇精选Articles专辑!关于(模糊)断点回归设计的100篇精选Articles专辑!匹配方法(matching)操作指南, 值得收藏的16篇文章等,⑪MIT广为流传的政策"处理效应"读本,⑫DID的研究动态和政策评估中应用的文献综述,⑬最新政策效应评估的四种方法,⑭政策效应评估的基本问题

下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

2.5年,计量经济圈近1000篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle




数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 | 官员方言  | 微观数据 | 内部数据计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验计量经济圈组织了一个计量社群,有如下特征:热情互助最多前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。

: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存