查看原文
其他

实证研究的诀窍, 因果识别,因果识别,因果识别

因果推断研究小组 计量经济圈 2020-02-22


凡是搞计量经济的,都关注这个号了

箱:econometrics666@sina.cn

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

||因果推断研究小组编辑整理||, 来源在文后.

双重差分DID的种类细分, 不得不看的20篇文章


这些诀窍讲的是“如何进行实证研究”,而不仅仅是“如何写实证论文”;但总的来看,“做”和“写”的差别并不大。


实证研究中最重要的三点是什么?是因果识别(identification)、因果识别、因果识别。务必阐明因果识别的策略(当然,首先要理解因果识别的策略是什么)。许多实证研究可归结为“A 导致了 B”,通常用某种回归估计进行佐证。你要解释你所看到的数据中的因果关系是如何被识别的。


1. 要描述哪些经济机制导致了自变量(右边变量)的差异。不过,上天赐给我们的真正的自然实验是少之又少的。


2. 要描述清楚残差中包含了哪些经济机制。除右边变量(自变量)外,导致左边变量(因变量)变动的因素还有哪些?


3. 因此,需要从经济学的角度说明扰动项为何与右边变量不相关。除非你做好了前面两项,要不然你无法解释清楚这一关键假设。


4. 从经济学的角度说明为何工具变量与右边变量相关,但与扰动项不相关。


5. 工具变量和控制变量之间的差异是什么?将 y 对 x 回归,何时 z 应作为自变量加到右边, 何时 z 应作为 x 的工具变量?


6. 对你所报告的每一个估计数字,要说明数据中哪些变量的差异导致了估计结果。例如, 加入固定效应之后,相应的解释会截然不同。在回归方程中加入公司固定效应后,每个公司内部的时变因素会影响回归系数。若回归方程中没有加入公司固定效应,回归系数往往取决于在某一时刻上各个公司之间的差异。


7. 你确信你看到的是需求曲线,而不是供给曲线吗?要想澄清这一问题,请自问“你在对谁的行为建模?”例如,你感兴趣的是利率如何影响住房需求,并用新增贷款量对利率作回归。但如果其他因素导致住房需求变得很大时,住房抵押贷款需求(以及与住房抵押贷款需求相关的其它贷款需求)也会抬高利率。你的暗含假设是需求曲线是不变的,价格的提高会降低需求量。但数据可能是因为供给曲线不变而产生的,从而增加的需求会抬高价格,或者需求与价格交互攀升。你是在对房屋购买者的行为建模,还是在对储蓄者的行为建模呢(储蓄会如何对利率变动做出反应)?


8. 你能肯定不会是 y 导致了 x?或者 z 同时导致了 y 和 x?看看下面反向因果关系的例子吧。例如:前一个例子也是一种因果关系:究竟是利率变动导致了住房需求的变动, 还是住房需求的变动导致了利率的变动呢(或者是整体宏观经济状况同时导致了利率和住房需求的变动)?


9. 仔细斟酌自变量中应包括哪些变量,不应包括哪些变量。大多数论文中引入的自变量过多。大可不必把决定 y 的所有因素都作为自变量。


a. R2 较高通常是坏事—这意味着回归方程是左脚的鞋子数量 = α + β×右脚的鞋子数量 + γ×价格 + 扰动项。右脚的鞋子数量不应该作为控制变量。


b. 不要做这样的回归:工资 = a + b×教育程度 + c ×行业 + 扰动项。固然,加入行业变量是会提高 R2,并且行业变量也是影响工资的重要因素(如果你做好了前述的第 2 项,它应该在扰动项里),但教育的主要目的是帮助人们进入更好的行业,而不是从助理汉堡师傅擢升为首席汉堡师傅。


只报告估计值和 p 值是不够的,要说明数据中导致估计结果的事实或规律。Fama 和 French 1996 年的论文《多因子解释》(Multifactor explanations)便是一个很好的例子。按照过去的文献惯例,只需要报告一个数字:GRS 检验。Fama 和 French 展示了每个投资组合的期望收益和 β 值,并说服读者相信期望收益的规律与 β 值的规律相吻合。虽然 GRS 检验糟糕透顶,但该文提出了近 15 年来最成功的因子模型!他们之所以成功了,是因为他们揭示了数据背后的固有规律。


务必阐明结果的经济上的重要性。除了说明核心数字统计上的显著性外,还应阐明它们在经济上的重要性。特别是对大型面板数据集,即便是极小的经济效应,在统计上也会显著。(对于大型面板数据集,若 t 统计量为 2.10,估计出来的效应确实非常微小!)


当然,每个重要的估计值都要报告其标准误。

作者:约翰•H•科克伦,芝加哥大学布斯商学院教授

来源: 节选自厦门大学《经济资料译丛》:经济学博士生论文写作指南

欢迎优秀社科学者到社群交流探讨最前沿的学术问题。

推荐阅读:

1.工企数据库匹配160大步骤的完整程序和相应数据

2.1998-2016年中国地级市年均PM2.5数据release

3.1997-2014中国市场化指数权威版本release

4.2005-2015中国分省分行业CO2数据circulation

5.中国所有地级市各类空间权重矩阵数据release

6.中国省级三大空间权重矩阵(相邻, 距离和经济)数据

5.实证研究中用到的135篇文章, 社科学者常用toolkit

可以到计量经济圈社群进一步访问交流各种学术问题,这年头,我们不能强调一个人的英雄主义,需要多多汲取他人的经验教训来让自己少走弯路。

计量经济圈是中国计量第一大社区,我们致力于推动中国计量理论和实证技能的提升,圈子以海内外高校研究生和教师为主。计量经济圈绝对六多精神:社科资料最多、社科数据最多、科研牛人最多、海外名校最多、热情互助最多、前沿趋势最多如果你热爱计量并希望长见识,那欢迎你加入到咱们这个大家庭(戳这里),要不然你只能去其他那些Open access圈子了。注意:进去之后一定要看小鹅社群“群公告”,不然接收不了群息,也不知道怎么进入咱们独一无二的微信群和QQ群在规则框架下社群交流讨论无时间限制。

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存