给中介效应加上因果关系内核, 让中介分析光明正大走入经济学研究！

Original 计量经济圈计量经济圈 2022-11-16

收录于合集

凡是搞计量经济的，都关注这个号了

稿件：econometrics666@126.com

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

鉴于，前面针对中介效应的争议，例如，1.《当代财经》期刊打响了经济学领域反对温忠麟中介效应模型的第一枪！2.针对经济学领域中介效应模型问题的回应和理性讨论，3.TOP5刊上五种常用机制分析方法及对应文献，今天，引荐一篇关于中介效应分析新方法的综述性文章《经济学中的因果中介分析：目标、假设和模型》。

正文

关于下方文字内容，作者：谢立成, 中南财经政法大学财政税务学院，通信邮箱：xielicheng666@126.com

1.将一般DID估计推广到多期干预前和干预后时期的政策效应, 附code和数据！2.AER未监测的污染, DID和事件研究法运用的典范(附代码)

Celli, V. (2022). Causal mediation analysis in economics: Objectives, assumptions, models. Journal of Economic Surveys, 36: 214– 234.
Abstract：Mediation analysis aims at identifying and evaluating the mechanisms through which treatment affects an outcome. The goal is to disentangle the total treatment effect into two components:the indirect effect that occurs due to one or more intermediate variables，known as mediators, and the direct effect that captures all other possible explanations for why a treatment works. This paper reviews the methodological advancements in the literature on causal mediation in ecoomics, specifically quasi-experimental designs. I define the parameters of interest， the main assumptions and the identification strategies under the counterfactual approach, and present the Instrumental Variables (IV), Difference-in-Differences (DID), and Synthetic Control (SC) methods.

经济学中的因果中介分析：目标、假设和模型

关于因果中介效应，参看：1.因果中介效应分析出现在顶刊, 是时候使用新方法了，2.政策评估中"中介效应"因果分析, 增添了文献和Notes，3.自变量和中介变量是内生的情况咋办？放在因果中介的框架

摘要：中介效应分析旨在通过处理变量影响结果变量来识别和评估机制。本文的目标是将总的处理效应分解为两个部分：由一个或多个中间变量(称为中介变量)产生的间接效应，以及包含所有其他可能解释处理效应的直接效应。本文回顾了经济学中因果中介分析的方法论进展，特别是准实验设计。在反事实方法下，本文定义了重要参数、主要假设和识别策略，并提出了工具变量(IV)、双重差分(DID)和合成控制方法(SCM)。

一、引言

经济学的大部分文献集中在因果分析上，这是评估政策处理因果效应的基本方法。因果分析回答了这样的问题：公共补贴有效吗? 研发激励能促进企业创新吗?然而，这种分析不能回答这些政策干预是否有效的问题。正如Gelman和Imbens(2013)所指出的，在许多问题中，”一因之果”和”一果之因”都是处理变量的效应，即实现总效应的机制都是相关的。在统计学中，标准的因果分析只能揭示一个政策对受到受到干预组别产生的影响。这意味着可以量化这种影响的大小，可以知道政策处理对结果的影响有多大，但这些估计没有说明影响渠道。虽然知道一些因果效应，但对其因果机制一无所知。

因果中介分析是一种研究因果机制并试图回答这些问题的标准统计框架。Imai et al.(2013)将机制定义为一个过程，其中重要的因果关系变量（即处理变量），通过一个中介变量影响结果变量，然后是内生变量，中介变量，它位于处理变量和结果变量之间的因果路径上。因此，研究因果机制比单独研究总体效应更有助于理解社会和经济效应。这使得决策者能够优化决策，提高效率。

中介研究的主要领域是心理学和社会学。例如，Brader等人(2008)在估计基于种族的媒介线索对移民偏好的总体效应时，超越了标准的因果分析。他们不是简单地证明媒介线索是否会影响结果，而是探索这种效应运行的机制。与早期表明基于群体的政治的情感力量的研究（Kinder&Sanders，1996）一致，作者发现基于群体的媒介线索导致的影响是通过改变个体的焦虑水平而产生的。

另一个例子可以从政治选举的文献中借鉴。Gelman和King(1990)发现在选举中存在显著的在任优势。几年后的1996年，Cox和Kats将在位优势文献引向了一个新的方向，他们考虑了在位者为何具有选举优势的可能因果机制。他们将在位优势分解为”威慑/质量效应”和其他因果机制的效应，如知名度和资源优势。中介机制在教育研究中发挥着越来越重要的作用。根据伽莫兰(2013，p.23)的描述：“政策研究人员面临的另一个关键挑战是了解项目和政策运行的机制。迄今为止，许多严谨的研究把这个过程当作黑匣子，寻求积极或消极的判断，而不了解最终的结果是如何达成的。如果政策研究能够提供更多机制方面的证据，那么下一代教育政策研究将会取得进展，从而政策的关键可以获得支持，并解决未能达到目标的项目中的关键问题。”

在《教育效能研究期刊》(Journal of Research on Educational Effectiveness)最近的一期特刊中，有人认为“这种中介分析的努力是知识构建的基础，因此应该成为政策评估研究的核心部分，而不是可选的‘附加部分’”(Hong， 2012)。教育领域的相关实证研究有Bijwaard和Jones(2019)，他们研究了教育通过认知能力对死亡率的影响，以及Heckman等人(2013)，他们研究了Perry Preschool计划通过认知和非认知机制的影响。

中介机制也是一种有趣而有前途的经济学方法。然而，经济学中因果机制的研究有更深入的起源，可以追溯到Sewall Wright(1921，1934)关于路径分析的工作。一个开创性的例子是弗里希(1938)。根据他的研究，因果模型是基于一个结构方程系统，该系统定义了一组变量之间的因果关系。这些结构方程是由将输入映射到输出的确定性函数表示的自主运行机制，引入了因果机制的概念，如Heckman和Pinto（2015a）所述。另一个基本贡献来自Haavelmo(1943)，他在定义”因果关系”时考虑到了一个精确的因果机制，他指出需要指定一个理论模型作为先验对象，必须用统计测量理论补充，以便拥有经验相关性和逻辑连贯性。

最近的例子有Simonsen和Skipper（2006），他们评估了母亲身份对工资的直接影响，以及Flores和Flores Lagunes（2009），他们评估了就业团队项目通过工作经验对收入的直接影响。其他贡献包括Huber（2015）的工作，他利用因果机制框架，利用1979年美国全国青年纵向调查的数据或Huber等人（2017）的数据分解工资差距，世卫组织调查了瑞士求职者咨询过程中更严格的个案工作者的就业效应是否通过就业市场项目的安置来调节。另一篇文献通过分析生产函数来研究产生处理效应的机制。最突出的例子是Heckman和Pinto（2015b），他们研究了在存在未输入测量或输入测量误差的情况下，改变输入或在输入和输出之间移动映射，对结果的总体影响变化。

然而，尽管中介机制框架对经济学家很有吸引力，并且因果机制的争论在经济学中有着悠久的历史，但对于哪种方法是最好的来面对这个话题，还没有达成共识，并且在文献中可以找到不同的贡献，如第2节所示。

本文介绍了在经济学中使用的主要方法，并开始深入了解以准实验设计为代表的前沿方法。从目前来看，在因果中介分析中，这些方法还没有得到认可，这使得准实验设计成为中介分析中的一个最新视角。

本文其余部分的组织如下：第2节介绍了经济文献中使用的主要方法的概述，第3节显示了中介分析中的反事实方法，并定义了感兴趣的参数;第四节分析中介分析所需的假设;第5节侧重于准实验设计，特别是显示工具变量(IV)，双重差分(DID)和合成控制方法;第六节给出本文的结论。

二、因果中介分析的不同方法

虽然中介分析的魅力对经济学家和政策制定者很有吸引力，但关于使用哪种方法的辩论仍未结束。

在经济学中，研究因果机制的传统方法是结构方程模型(SEM)——例如，详参Baron和Kenny（1986）的开创性研究。这种方法将政策处理效应定义为其回归系数，假设结果变量和中介变量也有两个参数模型。在这个定义框架中，效应是没有模型就不存在的数学对象，效应的定义及其估计方法没有分离(Nguyen等人，2020年)。中介分析研究的是因果效应，但传统回归分析的目标可能是因果效应或条件关联。Imai et al.(2011)强调了这种方法的局限性。作者表明，结构模型是基于误差项的不可检验的假设来给出参数的因果解释。特别是，他们证明了传统的外生性假设本身不足以识别因果机制。相反，这些假设是确定传统平均处理效应(ATE)的充分条件。除此之外，中介可以被解释为一种中间结果：在这样的模型中，本文应该控制大量的协变量(处理前和处理后)，根据选择的协变量，有可能产生不同的结果，然后增加估计的敏感性。另一方面，Heckman和Pinto (2015b)论证了计量经济学方法如何解决潜在的混杂效应，克服了统计学上的机制文献固有的隐性强假设。特别是，他们展示了如何利用一些处理变量的实验变化来增加作出因果描述所需的外生性假设的可信度。他们展示了如何在有实验数据的情况下放宽外生性假设，使线性模型成为分析因果机制的有用工具。

结构方程的另一个特点是，它们不考虑处理和中介之间的相互作用，这意味着中介对结果的叠加效应不取决于处理变量的值。此外，无论是处理变量对中介变量的叠加效应还是中介变量对结果变量的叠加效应，在所有可观测个体中都是相同的，这意味着这两种效应是独立的。如果使用非线性模型，系数乘积不会产生传统结构方程模型设定中的间接影响。在这些方面，结构方程模型存在一些局限性，随着时间的推移，这些局限性已得到广泛研究和解决。。

另一种方法是因果推理框架，其效应以非模型的方式定义。一个有用的框架是潜在结果或反事实设定，通常用于政策评估。在这种方法下，结构约束（SEM的典型特征）得到放松，因为它考虑了更一般的识别策略。例如Robins和Greenland (1992)， Pearl (2001)， Petersen等人(2006)，VanderWeele (2009)， Imai等人(2010)，Hong (2010)， Albert和Nelson (2011)， Tchetgen和Shpitser (2012)， VanderWeele(2012)等等。与经典处理分析一样，使用反事实方法而不是结构模型可以帮助将因果关系的概念形式化，而无需对参数的函数形式进行假设，并确保更灵活的识别步骤。此外，在这类模型中，不需要知道可能影响设计的整个协变量集。特别是，该方法的一个重要点是区分三个步骤：定义、识别和效应估计。这种区别是根本的，因为采用反事实方法通常不会消除在估计步骤中对一些模型假设的需要。但是，本文不必默认使用一组非模型定义的模型，可以根据数据以及对因果结构拥有或不拥有的先验知识来考虑使用什么模型(Nguyen et al.，2020)。

大多数文献通过假设处理和中介因子在给定观察特征的情况下是条件外生的来识别，这一假设称为序列可忽略性，由Imai等人(2010)和Imai等人(2011)提出。作者证明，在此假设下，平均因果中介效应是非参数识别的。这一结果在本文献中是一个重要的步骤，因为它建立了将中介效应解释为因果效应所需的最小假设集，而与研究人员使用的统计模型无关(Imai et al.，2010)。然而，这一假设并没有明确说明处理后的混杂因素，这可能混淆变量之间的关系。为了解决这些局限性，近年来，一些研究人员在中介框架内使用了准实验设计。幸亏有这些方法，可以使用不同的技术来控制中介的内生性，将在下面的部分中进行解释。在这类设计中，当对处理组的分配非随机时，必须评估政策的影响。没有随机化，评估设计方面的主要挑战是找到一个可以与处理组进行比较的对照组。在中介者在场的情况下，出现了额外的复杂性。准实验设计允许处理变量和中介变量存在内生性，这不能被观察到的协变量单独处理。如前所述，本文献基于反事实设定，其优点是缺乏明确的结果模型，这些方法在独立性、函数形式、排除和分布假设方面比计量经济学中的标准结构估计文献（Heckman，2008）做出的统计性假设更少。另一方面，仍有少数论文在机制中使用这些方法，但在过去几年中，中介机制文献对这些技术越来越感兴趣。

三、构建反事实的方法

3.1反事实中介框架的定义

最近关于中介分析的研究使用了反事实方法，这是因果推理中常用的框架。它是基于Neyman(1923)提出的随机实验的潜在结果设定，然后由Rubin(1974)推广到观察性研究.

根据主要的文献，形式上本文用D表示二元处理变量，用M表示中介变量，假设它有边界支持，可以是离散的或连续的，用Y表示结果变量。在这个框架中，潜在的结果被定义为Y(d’，m)，潜在中介为M(d)，其中d’∈{0，1}。因此，最终实际的结果值和中介值可以写成：

其中下标i是单位观测值。

很容易看出，对于每个单元i，只观察到两种潜在结果或中介状态中的一种。因此，不得不面对中介分析中的缺失值问题(Holland，1986)。由于存在两个驱动变量，本文还必须考虑它们之间潜在的相互作用，从而使分析更具复杂性。

中介分析的目的是将D对Y的总处理效应分解为间接效应和直接效应。第一个问题反映了政策处理为何有效的一种可能解释，明确定义了因果效应背后的一种特殊机制，并回答了以下反事实问题：如果中介从在处理条件下(即Mi(1))实现的，改变为到在控制条件下(即Mi(0))，同时保持d的处理状态，结果会发生什么变化？第二个是直接效应，它代表了处理影响一个结果的所有其他可能的解释，它对应于当外生性改变处理变量但保持中介变量固定在其潜在值Mi(d)时潜在结果的变化。这些方法评估处理效应的哪一部分是通过某个中间变量产生的，哪一部分是通过其他机制产生的，以便制定更好的政策备选方案。最后，中介分析是一套技术，通过研究人员可以评估这些直接和间接影响的相对规模。

3.2参数定义

使用潜在结果表示法，可以定义两个感兴趣的量。值得注意的是，在本节中，假设处理变量是二元变量，d ={0，1}，但是很容易将这些反事实的定义扩展到连续处理变量的设定。这两个数量如下：

NDE(d)：[Yi(1，Mi(d))-Yi(0，Mi(d))]是自然的直接效应，表示如果将处理外生性设定为1到0，结果将发生多大的变化，但对于每个个体，中介因子保持在处理状态d的水平。它捕捉了如果从处理变量到中介变量的途径被禁用，则处理变量对结果的影响将保持在什么水平，如图1所示

NIE(d)：[Yi(d，Mi(1))-Yi(d，Mi(0))]是自然的间接效应，表示如果处理变量设定为等量d，结果会发生多大变化，但中介变量从d =1时的水平改变到d =0时的水平。它捕捉了处理组通过中介作用对结果的影响，如图2所示。

这些影响是在个体层面上定义的，这意味着无法在每个观测i中观察到它们，因此如果没有更有力的假设，就无法直接识别它们。原因是，它们是根据相同个体的多个潜在结果定义的，并且在现实中只观察到其中一个潜在结果。其想法是使用第三种潜在结果Yi（d，Mi（1-d））将个体总效应分为两个部分。它代表了一个假设状态，其中处理组设定为一个条件d，但在另一个处理条件1下，中介变量设定为其潜在值1- d、这第三个量从未被观察到，但它的概念化有助于将总体效果分解为一个有意义的部分。为了识别自然效应，只有两个中介值相关，即M（0）和M（1），即中介在处理组和非处理组条件下自然产生的值，并且它们因个体而异。为了识别这些处理变量的自然效应，本文使用了人口平均数。基于潜在结果框架，本文将平均间接效应（ACME）定义为：

ACME对应于在处理状态和非处理状态下，当外生性地将中介变量转移到其潜在值，同时保持处理状态固定在D = d时平均潜在结果的变化。注意，右边方程只有一个变量是可观察到的，而另一个变量根据定义是不可观察的(在处理状态D下，从未观察到M在相反的处理状态下自然会有的值，即M（1-d）。

同样地，本文将平均直接效应(ADE)定义为：

它表示当中介变量设定为处理状态d下可能的潜在值时，处理变量对结果变量的平均因果效应。

有趣的是，ATE可以很容易地被改写为对相反的处理状态的自然直接和间接效应的总和：

本文通过简单地在第二个等式后加减反事实量E[Y(0，M(1))]，在第三个等式后加减E[Y(0，M(1))]来得到这些结果。这个结果可以用更一般的方式来写：

显然，在没有进一步假设的情况下，这两种效应都没有被确定：对于任何观测个体，只能观察到Y(1，M(1))和Y(0，M(0))中的一个，因为这两种结果不能同时观察到，如因果推理的基本问题(Holland， 1986)中所述。如前所述，对于任何个体来说，从未观察到反事实量Y(1，M(0))和Y(0，M(1))，因为从未观察到在相反的处理状态下定义的M的潜在值，而只知道遵循特定处理状态的事实M。为了解决这个识别问题，需要进行一系列适当的假设，这将在第4节中介绍。

这一框架同时反映了中介分析的弱点和优势。特别是，这个框架的难点在于，虽然中介分析是关于因果效应的，但这种效应在中介变量设定中并不直观明显。中介变量设定的挑战在于，本文没有与因果效应感知相对应的可观察效应作对比。尽管如此，采用明确的因果思维可以更清楚地知道到底想要学习哪种因果效应，以及是否能够学习以及如何学习它们。

如Δ的定义所示，根据d的选择，最终得到四个量，即NDE(0)， NDE(1)， NIE(0)，和NIE(1)，这意味着ATE的两种不同的分解。两次分解不存在单一的NDE和NIE，但一般来说，NDE(0)和NDE(1)不相同，NIE(0)和NIE(1)也不相同。这四个参数测量不同的量：NDE(1)解释了如果政策制定者将中介变量固定为它在处理中所接受的价值，那么处理效应将会是什么，而NDE(0)衡量的是如果能够完全去掉政策对中介变量的影响，本应会达到的处理效应。这两个量不一定相同。同样的逻辑也适用于间接效应：NIE(0)被解释为结果变量的变化，如果取消所有人群的处理，相反，却让每个个体采取她/他在处理中会采取的相同水平的M。NIE(1)再次测量由于M而不是处理本身导致的结果变化，将被处理的个体作为目标人群。这个问题揭示了传统方法的弱点，其中有一个任意的假设，这意味着总效应可以分为两个独立的、不相互作用的效应。有了这个符号，可以很容易地证明情况并非总是如此。因为ATE存在四个量和两种分解，可以选择其中的哪一个来使用，这取决于研究问题本身。如果目标是用直接和间接影响因素来描述政策干预（处理）对结果变量的影响，而不事先对直接或间接影响作出任何假设，那么就可以使用这两种分解方法。如果目的只是简单地描述学到的一切，那么就没有理由选择其中某一种分解方法。一般来说，当研究问题是：”一种政策处理的效果是否包括间接影响时，它与分解总效应有关，如TE = NDE(0) + NIE(1)”。当研究问题是：”一种处理的效应是否包含一个直接影响?”建议参考Nguyen等人(2020)以获得更多细节。

3.3加入控制变量的直接效应和间接效应

反事实表示法允许考虑异质性的潜在存在。这种异质性在实践和理论中都很重要，因为它往往是经济学家关注的内生性问题的动机(Imbens & Wooldridge， 2009)。在结构模型中，效应被假定为常数，这意味着各种政策的影响可以被单个参数捕获。在中介中，这种异质性甚至更为重要，因为它意味着处理组对结果的直接影响可能因个体而异，而且这种影响也可能因中介变量的不同值而不同。有了反事实的表示法，那么，非线性和交互项的存在就不是问题，因为本文的定义和分解都没有假定任何特定的模型或函数形式。然而，如果处理对整个人群的效果是相同的，也就是说，如果它不会因中介变量的不同而改变，那么处理变量和中介变量之间就不存在交互作用。

当引入另一个参数(文献中称为受控直接效应(CDE))时，这一事实就更清楚了。正式：

CDE(m)：[Yi(1， m)−Yi(0， m)]是受控制的直接效应，它表示在保持固定的M = m时，处理组和对照组之间的结果会发生多大的变化。这不是一种由m传导的效应，而是为m的每一层定义的效应，即为每个人设定一个特定的中介水平。如果效应在m的各个层次上变化，那么本文就存在D和M对Y的相互作用效应。

根据m值的不同，受控直接效应可能在个体之间和个体内部有所不同。如果所有人都希望中介变量的水平为m，并且存在可行和合乎道德的方式来为所有人设定中介的水平，那么采用CDE是有用的。值得注意的是，当m≠m'时，如果CDE(m) = CDE(m')，那么CDE就是简洁的，即CDE = NDE (Baron & Kenny， 1986)。

在这种情况下，总效应和CDE之间的差异就是间接效应，或者更正式一些。

通常，在实证分析中，受控直接效应和自然直接效应并不重合，总效应和受控直接效应之间的差异通常不会产生间接效应(Kaufman et al.，2004;VanderWeele， 2009)，因为变量受处理和中介对结果的影响可能只是相互作用，而不保证影响的额外线性函数形式。反事实表示法有助于捕捉这些相互作用的本质。

四、假设

4.1 古典假设

在经济学领域，通常无法进行对照实验。在这种情况下，就需要排除混杂因素的存在。然而，在中介分析中，由于变量关系的特殊结构，指出本文不得不面对什么样的混杂因素是很重要的。

考虑一个经典的中介框架，其中X是一组处理前的可观察协变量，W是一组处理后的可观察混杂变量，如图3所示。

例如，假设想评估一项补贴计划(D)是否提高了企业的生产率(Y)，以及研发投入的份额(M)是否可以部分调节这种影响。在这个例子中，研发方面的投资可能是一个潜在的中介，因为它们受到补贴的影响，进而可能至少部分影响生产率的结果。然而，为了将这种关联解释为一种因果效应，需要仔细考虑并控制那些可能混杂处理-结果关系(X)和/或中介-结果关系(W)的变量。例如，可能存在公司规模或公司绩效变量(X)会影响项目的参与(D)和公司生产力(Y)或其他因素，如管理质量或网络的存在(W)。影响研发投资水平和生产率。需要注意的是，W可能会受到处理本身的影响。

在此背景下，需要区分两种情况：已受控效应的识别和自然效应的识别。根据VanderWeele(2015)，要估计CDE，本文需要两个假设：

H1：处理组和结果变量之间不能存在混杂因素。

为了满足第一个假设，将处理变量随机化就足够了。通常，在经济学中，不存在实验，在这种情况下，处理变量的外生性必须由条件独立假设(CIA)保证：这要求影响处理分配和处理特定结果的常见变量是可观察的。这些变量必须消除处理和结果之间的潜在依赖关系。在统计学中，这种假设也被称为对可观察对象的选择，因为它的核心原则是产生依赖的公共变量的可观察性。如果参考前面的例子，为了满足H1，需要调整政策干预和结果变量的共同原因-例如关于公司规模或公司业绩的信息或任何其他因素(X)，可以在分析中混淆这种关系。或者可以随机给予补贴，这意味着接受处理和未接受处理的公司的X分布相同。

识别CDE需要的第二个假设是H2：中介变量和结果变量之间不得存在混杂因素。

H2是一个特殊的假设，在经典的因果分析或项目评估中不存在。由H2得知，应该控制处理后潜在混杂因素的存在，然后，为了满足这一假设，需要调整中介-结果关系的共同原因，例如，有关管理质量的信息或其他因素(W)，可以混淆这一关系。在这种情况下，需要仔细考虑所有可能的处理后的混杂因素，并将它们纳入分析，因为处理的随机化不再是控制w的充分条件。

要确定自然的直接和间接影响，需要两个假设。特别是：

H3：在处理变量和中介变量之间不能存在混淆因素.

H4：中介变量和结果关系之间不得有受处理变量影响的混杂因素

同样，为了满足H3，将处理随机化就足够了。事实上，可以把中介看作是一种中间结果。在这种情况下，如果处理是随机的，或者如果控制了与D和M相关的所有预处理变量，D和M之间的路径不会混淆。如果再次考虑前面的例子，公司的规模可以是处理-中介关系的一个混杂因素，那么它必须包含在协变量集(X)中，或者再次随机分配D。本文需要的最后一个假设是H4。

H4是一个强有力的假设，因为它要求从处理到中介的道路上没有任何阻碍，这也会影响结果。如果机制变量在处理后不久发生，这一假设更有道理(VanderWeele & Vansteelandt， 2009)。如果考虑H4，将不得不考虑可能受处理影响的因素，这些因素反过来可能会影响中介和/或结果。例如，获得补贴的公司可能会得到更多的好处(税收、官僚主义)，这反过来可能会影响研发投资和生产率。这个假设的问题是，即使在分析之前就想到了这些因素，也无法得到这些混杂因素的准确测量值，因为事先不知道它们在被处理后会是何值。

需要注意的是，假设1-4暗示了时间顺序的假设(Cole & Maxwell， 2003)。如果时间顺序假设不被满足，那么没有未测量的混淆假设也不被满足，那么关联就不能代表兴趣的因果效应。需要注意的是，随机化处理并不足以排除中介分析中的混杂问题。处理变量的随机化排除了D - Y和D - M混淆的问题，但不能保证M - Y无混淆因素的假设成立。这是因为即使处理是随机的，中介因子通常也不是随机的。关键是，未测量的M−Y的混淆不会对总效应的估计产生偏差，但会对直接和间接效应的估计产生偏差。

4.2序列可忽略性下的识别

关键的理解是，在随机性设计下，ATE是可以识别的，但直接和间接的影响是不可以的。即使存在处理和中介的双重随机化，在没有进一步假设的情况下也不能确定处理变量的影响。事实上，即使处理和中介都是外生的，然后满足传统的外生性假设，简单地结合T对M的影响和M对Y的影响也不足以识别间接效应。在这个方向上的一个重要步骤是被称为”序列可忽略性”的假设。对这一假设有不同的解释，有不同的含义和不同的形式。使用最多、可能也是最灵活的版本是Imai et al.(2010)给出的版本。在形式上，它表示为：

序列可忽略性假设的第一部分，式(4)是处理的经典条件独立性，也被称为无遗漏变量偏差，条件外生性或无混淆，如Imbens(2004)。通过公式(4)，没有未观察到的混杂因素影响给定X的处理和中介和/或结果，这意味着可以一致确定D对Y的影响和D对M的影响。在非实验设计中，这一假设的有效性取决于处理前协变量的丰富程度，而在实验设计中，如果处理是在X定义的分类中随机化或无条件随机化，则这一假设成立。序列可忽略性假设的第二部分，公式(5)表明，一旦以D和X为条件，就没有未观察到的混杂因素共同影响中介变量和结果变量。这意味着在中介和结果之间不存在未观察到的混杂因素，排除了X未捕捉到的处理后的混杂因素。这是一个强有力的假设，因为随机化的处理变量和中介因子并不足以使该假设成立，除此之外，如前一小节提到的，如果处理变量和中介因子在较短的距离内测量，这是更合理的。序列可忽略性的最后一部分，式(6)是常见的支持假设。根据倾向匹配得分的相关文献，在给定M和X的情况下，接受或不接受处理的条件概率大于0。根据贝叶斯定理，这意味着，如果M是离散的，Pr(Mi=m|Di=d，Xi=x) >0；如果M是连续的，则M的条件密度在给定D和X的情况下大于0。式(6)的主要含义是，在X的条件下，中介变量不一定是处理变量的确定性函数；否则，在不同的处理状态下，没有可比较的中介变量个体(Huber， 2019)。换句话说，为了比较由处理状态定义的同一组内的不同中介状态，一旦对D和X设定条件，M一定会有不同的值。在序列可忽略性下(方程4-6)，可以确定因果机制。此外，还有可能得到反事实量E(Yi(d，M(d’)|Xi=x))的非参数识别，如Imai et al.(2010)所证明的，这意味着平均自然直接效应(ADE)和平均自然间接效应(ACME)的非参数识别在标准因果中介分析中，反事实量的非参数识别如下：

其中，假设有一个连续的中介变量，第一个等式遵循迭代期望定律，利用式(4)建立第二个、第四个和最后一个等式；公式(5)建立了第三和第五个等式，而第六个等式是由Mi = Mi(Di)和Yi = Yi(Di， Mi(Di))，也被称为观测性规则(VanderWeele， 2015)或一致性假设(Imai et al.， 2011)。

反事实分析中使用的序列可忽略性与结构模型中使用的经典外生性假设显著不同。特别是，正如前面提到的，要确定因果机制，以及从T到Y再到M的间接影响，这对于处理变量和中介变量来说是不够随机化的。不同的是，如果使用结构模型，它只需要满足外生性假设，这意味着T和M的双随机化是充分的。然而，只有在不存在异质性效应的情况下，得到的估计是一致的。特别地，在第一种情况下，可以确定处理变量的因果中介效应(T→M→Y)，而在第二种情况下，只能确定中介的因果效应(T→M和M→Y)，这两个量只有在没有异质性的情况下才重合。在满足外生性假设和不存在异质性的情况下，可以始终只估计CDE，因为在这种特殊情况下这个量等于NDE。有趣的事实是，在异质性存在的情况下，如果处理变量和中介变量是随机的，外生性假设仍然成立，但M和Y的误差项之间的相关性不同于0，这意味着结构模型不能捕捉到对这种效应的偏差估计。

4.3序列可忽略性的其他解释

这个结果的主要限制是，非参数识别只在不考虑处理后混杂因素的情况下才有效，这意味着处理前可观察的混杂因素集必须足够控制，而这一要求并不总是可信的。Robins(2003)已经解决了这个问题。在他的完全随机因果解释结构树图模型（FRCISTG）中，他使用不同版本的序列可忽略性，第一部分与等式（4）相同，而等式（5）被替换为Yi(d’，m)⟂Mi(d)|Di=d， Zi=z，Xi=x，其中Z是处理后混杂因素的向量。这是一个重要的实践优势，因为它可以控制可能混淆中介体和结果之间关系的可观察变量。但这是以加入直接和间接效应之间不相互作用的参数假设为代价的：Yi(1，m)−Yi(0，m) = Bi，其中Bi是一个独立于m的随机变量。这个条件有两个含义：(i)不存在异质性，(ii)无论中介的水平如何，直接效应的值相同，即直接效应和间接效应之间的独立性。因此，有一个重要的均衡点：如果以后混杂因子为条件，需要假设一个非交互假设来识别自然效应，这是一个非常严格的条件且不允许非参数识别。另一方面，如果不以处理后的混杂因子为条件，而是假设所有的X都足以控制它们，那么就可以在没有任何参数限制的情况下非参数地识别效应。

Pearl(2001)给出了序列可忽略性的另一种表达。特别地，在定理1和定理2中识别平均自然直接效应和定理4中识别平均自然间接效应，他使用了一组不同的假设，在任何情况下都得到了Imai等人(2010)给出的ADE和ACME的相同表达式。值得注意的是，序列可忽略性暗含了Pearl的假设，而反过来的假设并不总是正确的，但在实践中，这只是技术上的区别。序列可忽略性的另一个优点是，它比Pearl的假设更容易解释，在Pearl的假设中，两个潜在量之间存在独立性。Pearl也指出了这种解释上的困难：”反事实独立性的假设只有在结构形式下才能得到有意义的证实”(Pearl， 2001，第416页)。

Petersen等人(2006)给出了序列可忽略性的进一步版本。他将方程[4]分成2个部分，Yi(d，m)⟂Di|Xi =x 和 Di⟂Mi(d)|Xi=x ，方程[5]同理。这只是数学上的差异，因为在随机化处理的实验设计中，(4)式与它们是等价的。为了确定自然直接效应，他们还假设非处理状态下的潜在中介值独立于潜在结果。通常来说，E[Yi(d，m)-Yi(0，m)|Mi(0) = m， Xi= x] =E[Yi(d，m)-Yi(0，m)|Xi= x]，这意味着中介因子在非处理状态下的潜在值Mi(0)不提供任何关于处理效应的额外信息。这个额外的假设对于确定反事实量Y(d，M(0))是必要的。在任何情况下，如果处理变量是随机的，这最后一个假设对于Imai et al.（2010）给出的非参数识别都是不必要的，这使其序列可忽略性再次成为一个更好的解决方案。

五、准自然实验的设计

最新的中介分析研究考虑了基于潜在结果框架的更通用的识别方法，通常用于处理评估(Rubin， 1974)，以克服结构模型的局限性。这种方法的黄金标准是处理的随机性，这在实验中很容易满足。当处理变量或中介变量不能从外部确定时，估计相关参数并给出因果解释的唯一方法是使用准实验设计，其中内生性可以在特定的假设下控制。中介分析借鉴了因果文献中的这些方法，以确定和估计因果机制,但迄今为止只有少数研究使用这些方法。在工具变量中可以找到一些例子(see for example Burgees et al., 2015; Dippel et al., 2019; Frolich & Huber , 2017; Geneletti, 2007; Imai et al., 2013; Jhun , 2015; Powdthavee et al., 2013; Robins & Greenland, 1992)，双重差分法（see Deuchert et al., 2019; Huber et al., 2017) and synthetic control (see Mellace & Pasquini, 2019）。在下一节中，本文将讨论其中一些目前还没有使用的关于断点回归的研究。

5.1 工具变量

一些文献通过工具变量(IV)方法处理因果机制(见Imai等人，2013;robins & greenland，1992，等等)。原因是，在一些实证应用中，序列可忽略性并不是一个充分的假设来排除处理后混杂因素的存在，一个工具变量可能是解决中介变量的内生性问题的一个重要工具。在其他情况下，即使在处理前的一组协变量条件满足条件后，处理变量也不是外生性的，第二种工具变量可以用于这种内生性。可以找到两种用IV进行中介分析的方式。一些作者通过结构模型确定了直接和间接影响。例如，Powdthavee等人(2013)通过中介收入研究了教育对主观幸福感(SWB)的影响。他们利用澳大利亚各州不同的教育法律时间和个人收入的冲击(如彩票中奖)分别作为处理变量和中介变量工具。假设中介变量之间是相互独立的，他们在2SLS框架内使用SEM估计直接和间接影响。其他研究使用了两种工具和参数识别，如burges等人(2015)和Jhun(2015)。Ten等人(2007)使用参数限制，如处理-协变量交互项作为中介工具，同时在结果模型中不存在处理-中介、中介-协变量和处理-协变量相互作用，这意味着强结构限制的识别模型。Dunn和Bentall(2007)、Small(2012)和Gennetian等人(2002)利用处理与观察到的协变量的交互项作为工具来确定中介因素对结果的因果效应的其他研究。Dippel等人(2019)最近发表了一篇文章。他们提出了一种新的识别策略，在存在所有关键变量内生性的情况下，使用单个工具打开因果关系的黑匣子。事实上，在中介分析中，大多数识别方法都假定这种处理与随机分配一样有效。它们的贡献并不假设任何关键关系中不存在内生性，也不需要额外的工具，但它在未观察到的变量之间强加了因果关系。这些方法的局限性在于，它们不允许直接效应和间接效应之间存在异质效应。

研究IV的中介分析的第二种方法是使用潜在结果框架。Chen等人(2017)做出了重要贡献，他们通过兄弟姐妹的大小(也被解释为生育选择)作为中介，研究了第二胎的性别对第一胎教育结果的影响。在他们的研究中，他们假设兄弟姐妹的性别是随机的，并在第二次出生时使用双胞胎指标作为中介工具(遵循Angrist等人的研究，2010;Black等人，2005;Rosenzweig & Wolpin， 1980)。他们的IV估计给出的因果解释仅限于符合条件的家庭，这些家庭的兄弟姐妹大小会随着第二胎双胞胎的增加而增加，即M(Z = 1) > M(Z = 0)，但另一方面，考虑到异质性效应，即处理变量和中介变量之间的相互作用。尤其值得一提的是，他们发现，有一个弟弟会降低头胎女孩的潜在兄弟姐妹体型，这种正面的间接影响抵消了对她教育结果的负面直接影响，导致总体影响接近于零。这些结果为以前的文献中没有发现的家庭环境中的性别偏见提供了新的证据。由于总效应的分解以及兄弟姐妹大小和兄弟姐妹性别之间相互作用所捕获的异质性的存在，这是可能的。Frolich和Huber(2017)给出了使用潜在结果方法的第二个贡献。他们使用反事实的框架，并使用两种不同的工具分别对处理变量和中介变量获得非参数识别，然后，允许他们的内生性。此外，工具变量和中介变量可以是离散的或连续的。他们的结果的主要优点是，他们识别了所有处理方案的自然和控制效应，克服了仅识别根据任一内生变量依从性定义子群CDE的局限性(见Miquel， 2002)。他们将这种方法应用于两项实证研究。其一是教育通过收入对社会生活结果的影响。1971年，英国将最低离校年龄从15岁提高到16岁(另见Brunello等人，2016;Oreopoulos， 2006)，而年度个人收入是由意外收入工具(加德纳和奥斯瓦尔德，2007;林达尔，2005)。他们发现教育对社会生活功能有正向影响，但分解总效应(LATE)显示出正向的直接影响，而间接影响接近于0且不显著。然后他们得出结论，教育影响社会功能，但通过不同于收入的机制(Huber等人，2017)。

5.2双重差分法

第一个贡献是由Deuchert等人(2019)提出的，该研究使用了不同于序列可忽略性和工具变量方法的框架来识别直接和间接影响。他们在子群体或阶层中应用双重差分(DID)方法(Frangakis & Rubin， 2002)，根据二元中介变量对是否受到处理的反应定义，揭示了总体效应，这意味着存在四个子群体：总是接受者、从不接受者、复制者和对抗者(例如，参见Angrist等人，1996)。特别地，他们识别出了对总接受者和从不接受者的直接影响，其中中介变量对是否处理没有反应，也就是说，是否处理不会改变机制的状态，对应的是已经受到控制的直接影响，然后他们识别出了间接影响和对复制者的直接影响，其中中介变量对处理有反应。他们使用的主要假设是经典的随机处理分配;第二种是来自于局部平均处理效应(LATE)文献的单调性假设(见Angrist et al.，1996;Imbens & Angrist， 1994)，排除了对抗者的存在。最后一组重要的假设是共同趋势假设，它来自DID文献，但现在是跨层次定义的。这一事实可以控制处理后的混杂因素，并允许不同的混杂因素对不同层次特定潜在结果的影响，只要这些差异是时间常数。正如本文所讨论的，在中介机制的重要层次下的利益影响的识别一直受到批评，因为在DID框架中不允许对复制者的直接和间接影响进行分解，而专注于可能不如整个群体有趣的子群体(VanderWeele， 2008)。但由于之前的一组假设，作者确定了对复制者的影响，他们提出了一个实证应用，其中对子群体的影响与政治决策相关。第二种批评涉及文献中中介和基本分类因果效应之间的混淆（VanderWeele，2012）。特别需要注意的是，E[Y1−Y0|M(1)=1， M(0) = 0]是处理变量对复制子组结果的总因果效应，它并不总是对应于中介效应。事实上，可以观察到，即使中间变量不影响结果，这种影响也可能是非零的，这意味着M不是中介。当M是处理变量对结果变量的影响的替代物时，这种情况就会发生：替代物关注的是处理对结果的影响是否可以通过处理对中间变量的影响来预测，而中介关注的是处理的影响是否通过中介进入结果。一个好的代理变量可能经常是一个中介机制，但并不是必要的(VanderWeele， 2012)。基本分类是研究代理变量的一个很好的框架，而自然效应(Pearl， 2001)是研究中介的合适概念。Lindsay(2012)给出了一个直观的例子，她提供的证据表明，职业学院项目(D)这一计划将对那些改变工作环境人的后续收入有重大影响，但对那些不会改变工作环境接触的人没有影响。在她的分析中，她使用贝叶斯方法进行基本分类，并使用协变量试图预测不同的个体属于哪个主要阶层。但是，即使这些假设成立，可能仍然存在一些中介结果关系的未测量混杂因素，如动机(U)，使M成为代理变量而不是中介变量，如图4。

一种可能的解决方案是使用基本分类方法研究中介，但需要添加序列可忽略性假设，以排除处理后混杂因素的潜在存在。

5.3 合成控制法

使用合成控制方法(SCM)研究因果机制的唯一贡献来自Mellace和Pasquini(2019)。该方法的主要优点是，即使只存在一个处理个体和几个控制个体，它也能估计总的因果效应(Abadie et al.，2010)。他们延展了SCM，允许将总效应分解为其直接和间接部分，从而定义了中介分析合成控制(MASC)。他们使用的步骤包括重新加权控制个体干预后的结果，方法是选择权重，使治疗组和对照组在干预前的可观察特征以及干预后的中介值中的距离最小化。这可以模拟在没有干预的情况下，如果中介设定为她正在处理的潜在中介，被处理者会发生什么情况(Mellace & Pasquini，2019)。特别是，他们采用了Abadie等人(2010)所提出的具有交互固定效应的动态因子模型。

六、结论

鉴于中介分析方法在过去几十年中在经济学中呈指数增长，本文回顾了中介分析的主要贡献。本文解释了中介分析如何解开因果关系的黑匣子，并展示其在经济应用中的潜力。中介机制揭示并衡量政策背后的因果机制，为经济学家提供更多的信息。这个框架不仅可以识别估计策略是否有效，还可以确定它为什么有效。虽然中介分析的目标对经济学家和政策制定者很有吸引力，但关于使用哪种方法的辩论仍未结束。本文接着介绍了主要的传统方法和新的替代方法，以准实验设计为代表。这些方法基于反事实的框架，利用对参数函数形式的假设缺失来估计处理变量的因果影响。此外，鉴于中介的内生性，反事实方法对协变量的选择不太敏感，这是一个关键问题。本文在中介框架内回顾了这些方法的重要支撑依据，讨论了工具变量、双重差分和合成控制方法，展示当前的成果和进展。演示了反事实框架如何适用于中介分析，以及它们如何共同提供一种替代解决方案以估计因果机制，并得出经济性和政策性的影响。

关于机制分析、中介和调节效应分析的文章：

1.计量回归中的交互项到底什么鬼? 捎一本书给你，2.计量经济学中"交互项"相关的5个问题和回应，3.实证机制分析那些事，机制分析什么鬼？，4.政策评估中"中介效应"因果分析, 增添了文献和Notes，5.内生变量的交互项如何寻工具变量, 交互项共线咋办，6.因果中介效应分析出现在顶刊, 是时候使用新方法了，7.中介和调节效应自助法检验，针对非正态截面数据，8.面板数据中介效应的计算程序, 打开面板这扇门，9.中介和调节效应操作指南, 经典书籍和PPT珍藏版，10.中介效应分析的四种方式, 原则方法和应用综述，11.中介效应分析的方法和模型, 一篇听说必须看的文献，12.多重中介效应的估计与检验, Stata MP15可下载，13.具有调节变量的中介效应分析, moderated mediation，14.具有调节变量的中介效应程序和数据, 独家解读相关结果，15.有限混合模型FMM,异质性分组分析的新筹码，16.省份/行业固定效应与年份固定效应的交乘项固定效应，17.面板数据中去中心化的交互项回归什么情况，18.面板交互固定效应是什么, 白聚山教授推动了最前沿的研究，19.广义合成控制法gsynth, 基于交互固定效应的因果推断，20.一个完整的实证程序, 以logit或ologit为例，21.跨数据比较回归系数技巧，22.U型, 倒U型, 还是线性关系, 你平常的做法不靠谱，23.DID中行业/区域与时间趋势的交互项, 共同趋势检验, 动态政策效应检验，24.机制分析做到极致的JPE趣文, 身高与收入，25.机制分析, 中介渠道, 调节效应必读系列合集，26.自变量和中介变量是内生的情况咋办？放在因果中介的框架，27.调节变量, 中介变量和控制变量啥区别与联系?28.多个中介变量如何检验中介效应?，29.中介变量需要放到回归中去吗?何时放何时不放?，30.机制分析, 中介渠道, 调节效应必读系列合集，31.三张图秒懂, 混淆, 中介, 调节, 对撞, 暴露, 结果和协变量的复杂关系，32.中介效应检验流程, 示意图公布, 不再畏惧中介分析，33.主流: KHB法测度中介效应, 无论线性还是非线性模型, KHB都能分解出直接和间接效应！34.控制、调节和中介变量，系说，35.学习机制分析应该阅读的经典材料有哪些？36.操作讲解中介效应机制分析：原理, 程序, Bootstrap方法及其应用，37.Top5最新: 为什么富有的父母有富有的孩子? 一篇学好机制分析的佳作！38.必读, 宗教是如何阻碍经济发展的? 基于DID, IV和各种机制分析的AER量化史分析！39.中介效应最新进展: 中介效应中的工具变量法使用方法及其代码！40.中介效应分析新进展和检验方法！41.中介分析: 一份实践者指南, 来自大牛的顶刊文章总结！42.重新思考BK中介模型, 关于中介效应分析的神话与事实！43.中文刊上用中介效应模型的实证文章? 这位学者使用频率很高！44.争议, 因果推断经验研究中的中介效应与调节效应，45.我最近看到AER, JPE文章, 人家用的就是类似中介效应三步走方法，46.针对经济学领域中介效应模型问题的回应和理性讨论，47.《当代财经》期刊打响了经济学领域反对温忠麟中介效应模型的第一枪！

下面这些短链接文章属于合集，可以收藏起来阅读，不然以后都找不到了。

2.5年，计量经济圈近1000篇不重类计量文章，

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle

李尚福、魏凤和双双被拿下，与美国一份报告是否有关？

圈内疯传某谣言

不要放过这些人渣

“辣条二哥”直追卫龙，麻辣王子工厂遇洪受关注

中金跳楼女生诡异之处。

给中介效应加上因果关系内核, 让中介分析光明正大走入经济学研究！

您可能也对以下帖子感兴趣

李尚福、魏凤和双双被拿下，与美国一份报告是否有关？

圈内疯传某谣言

不要放过这些人渣

“辣条二哥”直追卫龙，麻辣王子工厂遇洪受关注

中金跳楼女生诡异之处。

生成图片，分享到微信朋友圈

给中介效应加上因果关系内核, 让中介分析光明正大走入经济学研究！

您可能也对以下帖子感兴趣