无需检查协变量平衡性的CEM匹配, 到底有多神气和与众不同

Original 因果推断研究小组计量经济圈 2020-02-22

凡是搞计量经济的，都关注这个号了

邮箱：econometrics666@sina.cn

所有计量经济圈方法论丛的do文件, 社科数据库和各种软件都放在社群里.欢迎到因果推断研究小组交流访问.感谢Keio university的Ph.d团体对计量经济圈的支持.

推荐阅读：

1.实证研究中用到的135篇文章, 社科学者toolkit

2.计量经济圈经济社会等数据库合集, 社科研究大米

3.1998-2016年中国地级市年均PM2.5数据

完整版do file请到因果推断研究小组提取(文末阅读原文)，而计量社群相对稍晚一些上传。Contributor: @老A 群友

Coarsened Exact Matching(CEM)是是通过控制观测数据中混杂因素对政策结果影响的一种非参数方法，主要目的依然是使处理组与控制组的协变量的分布尽可能保持平衡，从而增强两组数据之间的可比性。CEM是一种单调性不平衡边界( MIB )匹配方法——这意味着参与组和对照组之间的最大不平衡可以由用户事先选择，而不是通过那些费力的事后检查和重复重新评估的过程来发现，并且调整一个变量上的不平衡不会影响任何其他变量的不平衡。

CEM通过预先的用户选择来限制模型依赖程度和平均处理效应估计误差，它能够将数据限制在共同支持范围内，符合一致性原则，对测量误差的敏感度较低，能够很好地用多重插补方法处理缺失值数据，可以完全自动化地进行这系列操作，即使是对于非常大的数据集，其计算处理速度也很快。在用CEM预处理数据之后，我们然后可以使用简单均值差异比较法，或者任何其他打算用于处理原始数据的匹配方法或统计模型。CEM还能够做多分类处理效应，在实验设计中创建随机分区，并评估极端的反事实。

CEM是一种“monotonoic imbalance reducing匹配方法”，而传统的PSM和马氏匹配等是一种“equal percent bias匹配方法”。关于这两者有什么区别，各位圈友可以读一读文后列出的相关文献，或者到因果推断研究小组讨论。计量方法也不是我们想象的那么简单，乱用、勿用各种方法是很多中文学术期刊普遍的现象，这是一个非常严重的问题，因此提高审稿人的计量水平很迫切。

CEM匹配与PSM匹配等传统匹配方法相比有什么突出优势：

1.不需以两组数据的共同区域为基础进行匹配(common empirical support)，满足一致性原则。例如，PSM在匹配前需进行两组人群特征分数的重叠性检验并确定共同区域，进而根据特征分数进行匹配，而CEM直接根据原始数据的经验分布进行匹配，满足一致性原则。

2. 能最大限度地保留原有样本，进而在政策效果评估时反映真实情况。例如，PSM匹配后处理组和对照组的数量必须相等，而CEM匹配后两组数量可以不相等，并在匹配过程中会产生权重变量(Weight)，以此来平衡每层中处理组和对照组的数量，因此能最大限度地保留原有样本，进而在政策效果评估时反映真实情况。

3. 减少对模型的依赖。例如，PSM需利用Logistic等回归模型拟合特征分数后进行匹配，而CEM是直接根据每个变量的理论分布进行匹配，因此减少了对模型的依赖。

做CEM匹配的步骤如下：

首先根据每个协变量进行分层；

其次运用精确匹配的算法根据样本的经验分布将每层中的研究对象进行精确匹配，保证每层中至少有一个处理组和一个对照组的研究对象，否则将该研究对象删除；

最后保留匹配成功的研究对象，用匹配后的数据库政策变量对结果变量的的影响。

在匹配前后需分别检验两组数据的不平衡性(multivariate imbalance measure)，即L1，L1的取值范围是[0,1]。若L1=0则说明两组数据完全平衡，若L1=1 则说明两组数据完全不平衡，越接近1则说明不平衡程度越大。若匹配后L1较匹配前的L1 有所下降则说明匹配效果较好。

CEM匹配后两组数据的样本量可能会不相等，因此CEM匹配过程中会产生权重变量(Weight)，以此来平衡每层中参与组和控制组的人数。

现在我们通过一些示例来看看CEM具体的操作和结果解读：

1.直接对处理组与对照组的结果变量均值进行比较，得到的均值差异为886，这作为将来与CEM匹配后所得到的处理效应进行比较的基准。

2.计算不平衡指数L1，这个指数的数值0.5主要是用来与”通过CEM匹配后“所得到的L1指数进行比较。下面还有各个协变量的L1指数和位于不同分位数上的均值，从中至少可以看出re74的分布是相当不平衡的。

3.通过CEM进行匹配后，我们可以得到一些匹配相关的信息和不平衡指数L1。与之前未经过匹配的L1指数相比，经过CEM匹配后确实改善了平衡性，从0.5下降到0.46。这里面的分层coarsen过程，都是通过CEM计算机制自动完成的。

4.现在，我们人为地设置教育的cutoff点，并通过这些点来进行分层。与上面通过自动化完成的CEM相比，有时候对于一些ordinal变量进行设置cutoff点，反倒是改善了匹配效果和协变量的不平衡性程度，L1指数进一步下降到0.43了。

5.当CEM匹配对数据进行预处理滞后，我们需要加上cem_weights(权重，因为各层里面的处理组与控制组不一定是平衡的)来获得政策处理效应。我们之前是有低估处理效应的可能性，仔细一看，现在的处理效应是高出之前未经过匹配时的处理效应100点。注：回归的时候根据因变量数据类型来选择相关模型，比如logit, probit, ologit, Poisson等，这个里面使用的是regess。这些都可以放在广义线性回归模型估计：所有线性回归的大仓库讨论。

6.如果通过cem匹配后仍然有不平衡性，我们可以再通过控制那些影响整体平衡性的变量来获得处理效应，比如本例中控制了re74和re75。从回归结果来看，控制了相关的不平衡变量所得到的处理效应与没有控制相关变量所获得的差不多。注：回归的时候根据因变量数据类型来选择模型，比如logit, probit, ologit, Poisson等。

7.通过k2k匹配可以保证每层里的处理组与控制组有相同数量的观测值，从而不需要weight(使用k2k的前提是数据量要足够大一些)。我们发现，k2k匹配后协变量的平衡性得到改善，此时的处理效应与没有使用k2k匹配时的情况相比要低很多，两者的值分别是989和886。

8.除了自身可以直接获得处理效应，CEM还可以用来改进其他传统的匹配方法，比如PSM、距离匹配和'遗传匹配'。下面就是在用CEM处理数据并保留匹配了的数据后再使用近邻匹配法所得到的处理效应。通过与下面的结果进行对比发现，CEM匹配确实能够改进近邻匹配(看显著性)。

下面是没有经过CEM匹配，而直接使用近邻匹配所得到的处理效应。

9. CEM还可以处理存在缺失值情况下的处理效应推断。如果想要进一步深入研究，请参阅下面这些文章和作者的主页或者到因果推断研究小组交流：

https://gking.harvard.edu/cem

文献

"Causal Inference Without Balance Checking: Coarsened Exact Matching" (Political Analysis, 2012)

"Multivariate Matching Methods That are Monotonic Imbalance Bounding" (JASA, 2011), “

"CEM: Coarsened Exact Matching in Stata” (Stata Journal, 2009, with Matthew Blackwell), “CEM: Software for Coarsened Exact Matching.” (Journal of Statistical Software, 2009),

"A Theory of Statistical Inference for Matching Methods in Causal Research” (2017).

do file提取链接:

https://pan.baidu.com/s/1AqUAV9p4jptEmEWtKtNrmQ

提取码: 在因果推断研究小组提取(文末阅读原文)，而计量社群相对稍晚一些上传.

Contributor: @老A 群友

对于因果推断研究中的匹配方法，各位圈友可以看看下面这10篇文章，里面既有经典文献又有操作程序和数据，还有各种解读和综述。

1.广义PSM,连续政策变量因果识别的不二利器

2.PSM倾向匹配Stata操作详细步骤和代码

3.PSM, RDD, Heckman模型的操作程序

4.处理效应模型选择标准，NNM和PSM

5.因果推断中的匹配方法:最全回顾和前景展望

6.内生性和倾向得分匹配, 献给准自然试验的厚礼

7.倾向值匹配与因果推论,史上最全面精妙的锦囊

8.匹配还是不匹配？这真是个值得考虑的问题

9.匹配比OLS究竟好在哪里？这是一个问题

10.倾向匹配分析深度(Propsensity matching)

11.PSM和马氏匹配已淘汰, '遗传匹配'成匹配之王

12.IV和Matching老矣, “弹性联合似然法”成新趋势

所有计量经济圈方法论丛的do文件, 社科数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

可以到计量经济圈社群进一步访问交流各种学术问题，这年头，我们不能强调一个人的英雄主义，需要多多汲取他人的经验教训来让自己少走弯路。

计量经济圈当前有几个阵地，他们分别是如下4个matrix：

①小鹅社群：数据软件书籍等所有资料(最多且更新频繁)，

②微信群：服务于计量经济圈社群群友(最活跃)，

③研究小组：因果推断, 空间计量, 面板数据(最专业)，

④QQ群：2000人大群服务于社群群友(最大)。

计量经济圈是中国计量第一大社区，我们致力于推动中国计量理论和实证技能的提升，圈子以海内外高校研究生和教师为主。计量经济圈绝对六多精神：社科资料最多、社科数据最多、科研牛人最多、海外名校最多、热情互助最多、前沿趋势最多。如果你热爱计量并希望长见识，那欢迎你加入到咱们这个大家庭(戳这里)，要不然你只能去其他那些Open access圈子了。注意：进去之后一定要看小鹅社群“群公告”，不然接收不了群息，也不知道怎么进入咱们独一无二的微信群和QQ群。在规则框架下社群交流讨论无时间限制。

只有进去之后才能够看见这个群公告

这样的洞庭湖决堤，实在让人同情不起来

李尚福、魏凤和双双被拿下，与美国一份报告是否有关？

抗洪靠嘴，堵漏靠沙？印度官员真是绝了！

有的人走了，却永远活着

圈内疯传某谣言

无需检查协变量平衡性的CEM匹配, 到底有多神气和与众不同

③研究小组：因果推断, 空间计量, 面板数据(最专业)，

④QQ群：2000人大群服务于社群群友(最大)。

您可能也对以下帖子感兴趣

这样的洞庭湖决堤，实在让人同情不起来

李尚福、魏凤和双双被拿下，与美国一份报告是否有关？

抗洪靠嘴，堵漏靠沙？印度官员真是绝了！

有的人走了，却永远活着

圈内疯传某谣言

生成图片，分享到微信朋友圈

无需检查协变量平衡性的CEM匹配, 到底有多神气和与众不同

③研究小组：因果推断, 空间计量, 面板数据(最专业)，

④QQ群：2000人大群服务于社群群友(最大)。

您可能也对以下帖子感兴趣