查看原文
其他

所有控制变量都不显著行不行呢?审稿人啥看法

计量圈社群 计量经济圈 2023-07-27

凡是搞计量经济的,都关注这个号了

邮件:econometrics666@126.com

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

社群群友提出了一个问题:大家知道控制变量显著的标准是什么,这篇文章中除了核心解释变量外,所有控制变量都不显著行不行呢?

针对这一问题,在国内外的讨论都非常很多,整体上分为两类观点:一方认为就算控制变量都不显著也不用在意,而另一方却认为需要在意,很可能这是reg monkey(回归猴子)的问题。
这里,我们整理了一下相关观点。

① 不在乎

1.我非常怀疑审稿人会仔细检查控制变量的显著性到这个水平。查看顶级期刊,大多数文章不报告任何控制变量的估计值。他们通常讨论如下:我们估计 y=a+bx+cZ+e,其中 Z 是控制变量,包括什么什么... 。这是你第一次也是最后一次在这篇文章中听到对控制变量的提及。几乎没有对控制变量的讨论,甚至对控制变量的点估计结果没有被呈现到表格里。更不用说它们的意义了。

未讨论控制变量的原因是因为它们不用于控制遗漏变量偏差之外的目的。具体可以参考:1.连续DID如何做? 一篇关于土豆的经典文献, 让这一方法在国内外大放异彩,2.QJE新任主编AER上"非洲奴隶贸易与不信任的起源", 一篇堪称经典的截面数据实证论文,3.刚2022年, Acemoglu就在QJE上发文了!OLS+IV走遍天下都不怕!4.控制变量! 控制变量! 控制变量! 5.中国学界F4发表AER一篇! 知识青年上山下乡与农村教育问题!

2.我同意。在此之前,我也没有考虑过,而要点恰恰是控制变量的重要性并不重要。

3.本质上,控制变量有些随意。选择一个合理的组合,但不要迷恋它们。你可能在实证设计中有更大的问题需要解决,因此请专注于这些问题。在审稿人拒掉一篇论文的众多原因中,控制变量在众多因素中占据的位次相对较低,审稿人总是(并且会)要求你添加他们认为合适的内容。

4.那不是问题。包含控制变量的目的是防止控制变量对结果变量造成的混淆影响(这是遗漏变量偏差的经典案例)。控制变量的显著性本身不是很重要,因为它们的重要性与你对遗漏变量偏差的调整程度无关——如果包括控制变量,实际上你就针对它们的遗漏可能产生的偏差进行了调整。

5.包含控制变量的原因之一正是因为它们可以影响其他变量。在这种情况下,控制变量的统计显著性完全无关紧要。

但是,你可能会遇到不同意你这种想法的(控制变量显著性不重要)期刊编辑。

6.这取决于你如何选择控制变量。如果它们都不显著,则意味着你选择的控制变量对结果无关紧要。如果是这样,那你为什么选择他们?

如果你选择它们,是因为你所在领域的一些公认的理论或常识,那么“即使表明它们无关紧要”也很重要,在这种情况下你应该保留它们并进行讨论。

如果你在没有充分理由的情况下自行选择控制变量,那可能意味着你没有选择到值得关心的重要变量。在这种情况下,请重新考虑你对控制变量的选择。

②在乎

1.明显的Reg monkey 问题。参考,1.实锤! TOP刊上30%文章使用控制变量实现统计和经济显著性!2.实证中最佳控制变量组合使结果显著的程序及用法?3.控制变量就能影响结果显著性, 所以存在很大操作空间, 调参数是常用手段吗?4.加入其他控制变量后, 估计系数的符号相反了?
2.在没有x1的情况下做一下回归,即Y=a+c*control。如果控制变量没有变得显著,那么你的代码可能是错误的。
3.为一名审稿人,我会有点怀疑,但这不构成硬拒稿的理由,只是有些可疑。
4.共线性问题可能造成为什么你的控制变量都不显著,而且也可能会影响你核心解释变量的系数。
5.只做一个简短的评论:在某些方面,尝试使用和不使用某些变量的的方法是p-hacking一个方面。
6.你没有收到过我曾经收到过的审稿报告,审稿人对控制变量有一种奇怪的迷恋。

7.通常都很显著但在你这里变得不显著的控制变量,可能表明你的数据和样本存在问题。

8.我如果在工资回归方程中看到多年工作经验变量不显著,就会认为数据和样本有些不可靠。当然,这最终取决于变量和上下文。

③ 社群讨论

针对这一问题,计量社群群友也展开非常有益的讨论,不过就立场而言,与前面类似,也分成了2个观点鲜明的竞争性立场:一方觉得不用关注,一方觉得应该适当的关注。


关于回归中变量的问题

1.什么时候应该使用回归分析?控制变量意味着什么?2.如何选择正确的因变量(控制变量),让你的计量模型不再肮脏,3.调节变量, 中介变量和控制变量啥区别与联系? 4.控制、调节和中介变量,系说,5.核心解释变量A不显著, 但加入变量B后, 为什么A和B都显著了?6.被解释变量比解释变量的层级更高的模型设定合理么?7.审稿: 协变量何时重要? 哪个重要, 有多重要?8.三张图秒懂, 混淆, 中介, 调节, 对撞, 暴露, 结果和协变量的复杂关系,9.因果推断专题:6.再谈混淆变量,10.什么时候需要标准化回归模型中的变量?11.因果推断专题:1.混淆变量,12.虚拟变量回归模型是什么? 政策评估的前件,13.11种与机器学习相关的多元变量分析方法汇总,14.回归中各变量的数值相差过大有事, 又有什么问题?15.哦, 不, 回归符号反了, 我们该怎么办?16.回归系数与预期相反时, 我们能够采取的方法和思路有哪些?17.显著不显著的后背是什么, 非(半)参估计里解决内生性,18.在什么情况下多增加一个自变量后, 回归的R方会变小呢?19.控制变量选择问题: 如何鉴别好或不好的控制变量?附上14篇相关文章!20.如何测度不可观测变量遗漏的严重程度, 建议各位学者看过来!21.如何选择合适的工具变量, 基于既有文献的总结和解释!22.如何选择合适的工具变量, 基于既有文献的总结和解释!23.如何测度不可观测变量遗漏的严重程度, 建议各位学者看过来!24.社会网络计量经济学是什么?测度社会关系网中的同伴效应!25.社会网络分析最新文献和软件学习手册,26.添加一个新变量能使以前不显著的变量变得显著了?27.加入其他控制变量后, 估计系数的符号相反了?28.估计工具变量回归时, 是否必须将所有外生变量用作工具变量?29.实证分析观测数据的10条检查清单, 消除实证分析中许多潜在的虚假结果,30.可以在面板回归分析中使用时间序列解释变量或被解释变量吗?31.收入和年龄等变量是将其转化成有序离散变量还是当成连续变量进行回归呢?32.你确定找到一个好的工具变量了吗? 这将是一篇最值得你看的文章!33.因没阅读主编最新文章, 被知名期刊主编竟无情desk reject! 到底是什么方法方面的文章呢?34.审稿人有义务告诉你回归中可能的遗漏变量么?,35.回归中常数项显著说明模型中有遗漏变量问题?

下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

5年,计量经济圈近1500篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle




数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 | 官员方言  | 微观数据 | 内部数据计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验计量经济圈组织了一个计量社群,有如下特征:热情互助最多前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存