查看原文
其他

Heckman模型和工具变量IV之间的差异?

计量经济圈 计量经济圈 2022-10-02

凡是搞计量经济的,都关注这个号了

邮箱:econometrics666@126.com

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

前不久,社群讨论了1.“显著不显著的后背是什么, 非(半)参估计里解决内生性”,2.“计量社群里关于使用交互项还是中介效应分析开展机制研究的讨论”,3.“为啥面板数据回归中, 即使X对Y的解释程度很大, 但R-square一般都很小?”,4.多期DID中使用双向固定效应可能有问题! 又如何做平行趋势检验? 多期DID方法的最新进展如何?,5.收入和年龄等变量是将其转化成有序离散变量还是当成连续变量进行回归呢?6.控制变量就能影响结果显著性, 所以存在很大操作空间, 调参数是常用手段吗?7.回归中常数项显著说明模型中有遗漏变量问题?8.审稿人有义务告诉你回归中可能的遗漏变量么?9.针对很多实证问题的讨论, 随手保存的部分内容以飨学者,10.未引入交互项主效应为正, 引入后变为负, 解释出来的故事特别好, 主效应符号确实增强了故事性,11.双向固定效应多期DID最新进展和代码汇总, 关于控制变量和固定效应选取的讨论,12.逐年匹配的PSM-DID操作策略, 多时点panel政策评估利器,13.多期DID前沿方法大讨论, e.g., 进入-退出型DID, 异质性和动态性处理效应DID, 基期选择问题等,14.针对经济学领域中介效应模型问题的回应和理性讨论,15.讨论a(b)对b(a)的新方向论文, 经济学期刊分区问题, 3个机制存在时计量模型设计问题,16.如果解决了内生性, 那么是否意味着证实了变量之间的因果关系呢?17.解释变量提升一个标准差,被解释变量提升几个百分比呢?18.关于DID中对照组与处理组的比例问题?19.双重差分法和事件研究法的区别主要在哪里?20.双重差分法和事件研究法的区别主要在哪里?21.统计上不显著的变量表明该变量对结果变量没有影响吗?22.IV与Y在理论上无直接关系, 但用Y对IV做回归发现IV是显著的, 这是咋回事?等等。这些讨论中有很多非常高质量的内容值得被记录起来,因此后面会形成一个计量圈社群讨论专栏。

正文

计量社群里讨论了一个关于”Heckman和IV模型区别“的问题。

 Q:两阶段模型:Heckman模型(处理样本选择问题)和工具变量(处理内生性问题)之间的差异?

各位老师好,我想弄清楚样本选择和内生性之间的差异,以及Heckman模型与工具变量回归的不同之处。话说,样本选择是一种特定形式的内生性是否正确呢?其中,内生变量是个体被处理的可能性吗?另外,在我看来,Heckman模型和 IV 回归都是两阶段模型,第一阶段预测个体被处理的可能性,但它们在实现的目标和假设方面肯定有所不同, 但具体是什么呢?

先了解一下,1.Heckman两步法是什么? 及其内生性问题?  2.关于工具变量的材料包, 标题,模型,内生变量,工具变量

A1:样本选择是内生性的一种特定形式(参见 Antonakis 等,2010 年对内生性和常见补救措施进行了综述),但内生变量并不是个体被处理的可能性,而是处理变量本身(处理变量的非随机性分配)。内生性,是指错误地确定了因素 X 和因素 Y 之间的因果关系的情况,观察到的“关系”实际上是由于另一个共同影响因素X 和Y的因素Z。换句话说,给定回归模型:

yi=β0+β1xi+...+ϵi

当一个或多个预测变量与模型中的误差项相关时,就会出现内生性, 即当Cov(x,ϵ)≠0时。

内生性的常见原因包括:

  1. 遗漏变量(一些我们无法测量的东西)

  • 动机/选择

  • 能力/天赋

  • 自选择

  • 测量误差(想包括 xj,但我们只观察到了xj*)

  • 同时性/双向性(在 5 岁以下儿童中,作为营养状况指标的“对应年龄的体重”与儿童近期是否患病之间的关系可能是同时的。

  • 不同类型的问题需要稍微不同的解决方案,这就是 IV 和 Heckman修正之间的差异所在。尽管这些方法的基本机制存在差异,但他们前提是相同的:即要消除内生性,理想情况下满足排除限制条件(exclusion restriction),即在 IV 情况下有一个或多个工具变量或Heckman情况下有一个影响选择但不影响结果变量的变量。

    一方面,当一个或多个变量内生确定的,并且根本没有好的代理变量纳入模型中以消除内生性时,我们应该使用工具变量 (IV) 法,但此时,要记得在整个样本中我们都能够观测到所有协变量和结果变量。另一方面,当存在数据截断时,使用 Heckman 类型的修正方法,此时,在选择变量的值 = 0 的样本中,我们并不能观测到协变量和结果变量。

    工具变量 (IV) 方法

    使用两阶段最小二乘 (2SLS) 估计量进行 IV 回归的经典计量经济学示例:教育对收入的影响。

    Earnings =β0+β1Education+ϵi   (1)

    在这里,教育成就是内生的,因为它部分取决于个人的动机和能力,这两者也会影响一个人的收入。动机和能力通常无法在家庭或经济调查中得到衡量。因此,方程(1)可以写成包括动机和能力:

    Earnings = β0+{β1Education+β2Motivation+β3Ability}+ϵ   (2)

    由于实际上没有观察到 Motivation和Ability,因此方程(1)可以写为:

    Earnings = β0+β1Education+u   (3),

    其中 u=β2Motivation+β3Ability+ϵ  (4)。

    因此,通过 OLS估计教育对收入影响的估计是有偏差的。

    在实证中,人们将父母的教育作为衡量个体自身教育水平的工具变量。它符合有效工具 (Z) 变量的 3 个要求:

    1. Z必须与内生预测变量相关——Cov(z,x)≠0,

    2. Z不能与结果变量直接相关——Cov(z,y)=0,并且

    3. Z不能与不可观察的 (u) 特征相关(即Z是外生的)——Cov(z,u)=0

    当在第一阶段使用父母的教育(MumEducation 和 DadEducation)来估计个体教育(Education),并在第二阶段使用个体教育的预测值(Education^)来估计 Earnings,此时,估计的Earnings是基于不受动机/能力决定的真实Education部分。

    Heckman式校正

    非随机样本选择是一种特定类型的内生性。在这种情况下,遗漏变量为个体是如何被选入样本的。通常,当遇到样本选择问题时,结果变量只会在样本中“选择变量 =1”时被观测到。此问题也称为“偶然断尾”,解决方法通常称为 Heckman修正。计量经济学的经典例子是已婚妇女的工资:

    Wage=β0+β1Education+β2Experience+β3Experience2+ϵ   (5)

    这里的问题是,Wage仅能在工作的女性群体中观测到,因此起初的估计值会产生偏差,我们不知道对于那些不参与劳动力的人的工资是多少。方程(5)可以重写以表明它是由两个潜在模型共同确定的:

    Wage=Xβ′+ϵi   (6)

    LaborForcei*=Zγ′+νi   (7)

    即,如果LaborForce>0,Wage=Wage∗;如果LaborForce<=0, Wage=缺失值。

    因此,这里的解决方法是使用Probit模型和符合排除约束条件的变量(此处也适用于工具变量)预测第一阶段个体参与劳动力市场的可能性,计算预测的逆米尔斯比率 λ^,在第二阶段,使用 λ^作为模型中的预测变量来估计工资(可以看看Wooldridge 2009)。如果 λ^的系数在统计上等于 0,则表明不存在样本选择问题(内生性),此时OLS 结果是一致的。如果 λ^的系数在统计上显著不等于零,则需要报告来自Heckman修正模型的系数。


    A2:应该区分特定的 Heckman样本选择( Heckman sample selection 模型(仅观测到一类样本和Heckman型校正( Heckman-type corrections以纠正自选择(适用于两类样本都能被观测到的情况)。后者被称为控制函数法,相当于在第二阶段中包含一个新变量以控制内生性。关于控制函数法,1.控制函数法CF, 处理内生性的广义方法,2.非线性模型及离散内生变量处理利器, 应用计量经济学中的控制函数法!

    以一个带有内生虚拟变量D、工具变量Z的方程作为例子:

    Y = β+β1D+ε

    D = γ+γ1Z+u

    两种方法都先运行第一阶段(拿D对Z做回归),IV 使用标准 OLS(即使 D 是虚拟变量),Heckman使用Probit模型。除此之外,主要区别在于他们将第一阶段用于主方程的方式:

    • IV:通过将 D 分解为与 ϵ不相关的部分来消除内生性:Y=β+β1D^+ϵ

    • Heckman:保留内生变量D,但添加第一阶段预测值的函数。对于这种情况,这是一个相当复杂的函数:Y=β+β1D+β2[λ(D^)−λ(−D^)]+ϵ,其中 λ()是逆米尔斯比率。

    Heckman过程的优点是它提供了对内生性的直接检验:系数 β2。另一方面,Heckman过程依赖于误差的联合正态性假设,而IV不做任何这样的假设。

    所以在误差的联合正态性情况下,控制函数会比IV更有效(特别是如果使用MLE而不是这里的两步法),但如果正态性假设不成立,IV估计会更好。随着研究人员对正态性假设的怀疑越来越多,IV实际上被更频繁地使用。


    A3:来自 Heckman、Urzua 和 Vytlacil(2006 年):

    选择偏差示例:考虑一项政策对国家GDP的影响。若那些即使在没有该政策的情况下也能做得很好的国家是采纳该政策的国家,那么 OLS 的估计就是有偏差的。

    可采用两种主要方法来解决此问题:(a)选择模型和(b)工具变量模型。

    选择方法对条件均值的水平进行建模,IV 方法对条件均值的斜率进行建模,IV方法没有识别出选择模型中估计的常数。

    The IV approach does not condition on D (the treatment). The selection (control function) estimator identifies the conditional means using control functions.

    当使用带有曲率假设的控制函数时,在选择模型中不需要排斥限制条件(不需要Z不等于X)。通过假设误差项分布的函数形式,可以排除结果方程的条件均值等于条件控制函数的可能性,从而可以在没有排除限制的情况下对选择进行修正,还是建议看看Heckman和Navarro(2004)。


    关于显著或不显著结果,参看:1.常用的12种调变量显著性或调星星的方法,2.不显著能任性发顶刊!还津津有味地讨论不显著的实证结果!3.前沿, 终于有人解释为什么顶刊上很少有不显著的结果发表! 背后机理?4.回归中常数项显著说明模型中有遗漏变量问题?5.为什么回归系数不显著? 6.关于模型中变量选择的五个误区, 譬如不显著的变量需要剔除还是保留?7.控制变量就能影响结果显著性, 所以存在很大操作空间, 调参数是常用手段吗?8.添加一个新变量能使以前不显著的变量变得显著了?9.核心解释变量A不显著, 但加入变量B后, 为什么A和B都显著了?10.若系数回归结果不显著, 我们能够采取的方法和思路有哪些?11.结果不显著但成功发在Top期刊上的论文有哪些?你心虚过没?12.交互效应显著的几种情况, 列出了6种类型,13.交互项中主效应不显著, 交互项显著可怕吗? 14.统计显著与经济显著, 发AER和经济研究的标配,15.显著不显著的后背是什么, 非(半)参估计里解决内生性,16.试了几百次, 回归结果依然不显著, 到底咋办,17.科学家倡议P值需要0.005,显著性判断才成立,18.SSCI期刊竟公开征集“不显著的实证结果”的专刊文章!19.IV与Y在理论上无直接关系, 但用Y对IV做回归发现IV是显著的, 这是咋回事?20.实证研究中的P值: 误解, 操纵及改进, 探析P值操纵表现及原因,提出相应的改进策略,21.AER强调计量方法的重要性, 经济学因果分析中的p值操纵和发表偏倚!

    关于工具变量,参看1.内生性问题操作指南, 广为流传的22篇文章,2.看完顶级期刊文章后, 整理了内生性处理小册子,3.如何寻找工具变量?得工具者得实证计量,4.内生性处理的秘密武器-工具变量估,5.工具变量在社会科学因果推断中的应用,6.为你的"工具变量"合理性进行辩护, 此文献可以作为范例,7.没有工具变量、断点和随机冲击,也可以推断归因,8.工具变量与因果推断, 明尼苏达Bellemare关于IV的分析,9.工具变量IV与内生性处理的精细解读,10.我的"工具变量"走丢了,寻找工具变量思路手册,11.面板数据里处理多重高维固定效应的神器, 还可用工具变量处理内生性,12.豪斯曼, 拉姆齐检验,过度拟合,弱工具和过度识别,模型选择和重抽样问题,13.工具变量先锋 Sargan,供参考,14.AEA期刊的IV靠不靠谱?15.计量大焖锅: iv, clorenz, rank, scalar, bys, xtile, newey, nlcom,16.GMM是IV、2SLS、GLS、ML的统领,待我慢慢道来,17.IV和GMM相关估计步骤,内生性、异方差性等检验方法,18.因果推断IV方法经典文献,究竟是制度还是人力资本促进了经济的发展?19.内生变量的交互项如何寻工具变量, 交互项共线咋办,20.面板数据、工具变量选择和HAUSMAN检验的若干问题,21.IV和Matching老矣, “弹性联合似然法”成新趋势,22.IV回归系数比OLS大很多咋回事, 怎么办呢? ,23.不用IV, 基于异方差识别方法解决内生性, 赐一篇文献,24.找不到IV, RD和DID该怎么办? 这有一种备选方法,25.内生转换模型vs内生处理模型vs样本选择模型vs工具变量2SLS,26.内生性, 工具变量与 GMM估计, 程序code附,27.GMM和工具变量在面板数据中的运用,28.关于工具变量的材料包, 标题,模型,内生变量,工具变量,29.必须使用所有外生变量作为工具变量吗?30.工具变量精辟解释, 保证你一辈子都忘不了,31.毛咕噜论文中一些有趣的工具变量!33.前沿: 删失数据分位数工具变量(CQIV)估计, 做删失数据异质性效应分析34.不需要找工具变量, 新方式构建工具变量, 导师再也不用担心内生性问题了!35.关于顶级外刊工具变量的使用最全策略, 不收藏反复读就不要谈IV估计!36.如何通过因果图选择合适的工具变量?一份关于IV的简短百科全书37.前沿: nature刊掀起DAG热, 不掌握就遭淘汰无疑!因果关系研究的图形工具!38.最清晰的内生性问题详解及软件操作方案!实证研究必备工具!39.中国女学者与其日本同行在JPE上发文了!利用独特数据, 地理断点RDD和IV研究中国环境议题!40.双胞胎样本解决遗漏变量和测量误差, LIV解决选择偏差41.内生性处理的秘密武器-工具变量估计42.工具变量IV必读文章20篇, 因果识别就靠他了43.看完顶级期刊文章后, 整理了内生性处理小册子44.“内生性” 到底是什么鬼? New Yorker告诉你,45.Heckman两步法的内生性问题(IV-Heckman),46.最全估计方法,解决遗漏变量偏差,内生性,混淆变量和相关问题47.非线性面板模型中内生性解决方案48.内生性处理方法与进展49.内生性问题和倾向得分匹配50.你的内生性解决方式out, ERM独领风骚51.面板数据是怎样处理内生性的52.计量分析中的内生性问题综述53.一份改变实证研究的内生性处理思维导图54.Top期刊里不同来源内生性处理方法55.面板数据中heckman方法和程序(xtheckman),56.控制函数法CF, 处理内生性的广义方法57.二值选择模型内生性检验方法58.2SRI还是2SPS, 内生性问题的二阶段CF法实现59.非线性模型及离散内生变量处理利器, 应用计量经济学中的控制函数法!60.最全利用工具变量控制内生性的步骤和代码—在经管研究中的应用,61.如何选择合适的工具变量, 基于既有文献的总结和解释!62.中介效应最新进展: 中介效应中的工具变量法使用方法及其代码!63.弱工具变量的稳健性检验, 附上code和相关说明!64.工具变量对因果效应的识别和外推, 大牛的顶级评述!65.刚2022年, Acemoglu就在QJE上发文了!OLS+IV走遍天下都不怕!66.如何在AER上用OLS发经济史研究, 这篇道出了验证IV合理性的标准范式! 必读,67.怎样找到一个巧妙的工具变量, IV在公共政策评估中的应用,68.Bartik工具变量是什么? 份额移动法IV应用越来越多,69.阿西莫格鲁又一篇使用IV做因果推断的经典文献, 拿起小板凳一睹为快!70.AER教你两种论证IV合理性的实证策略, 以及如何对IV做安慰剂检验,71.我们应该在多大程度上相信工具变量估计, 基于63份顶刊复制结果的操作建议


    下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

    2.5年,计量经济圈近1000篇不重类计量文章,

    可直接在公众号菜单栏搜索任何计量相关问题,

    Econometrics Circle




    数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 | 官员方言  | 微观数据 | 内部数据计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验计量经济圈组织了一个计量社群,有如下特征:热情互助最多前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存