查看原文
其他

被质疑: X与Y相关系数与回归系数截然相反, 你咋想的?

计量圈社群 计量经济圈 2023-07-27

凡是搞计量经济的,都关注这个号了

邮箱:econometrics666@126.com

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

群友在计量社群询问一个问题:“在经济学等社科实证研究中,有可能X与Y的相关系数为正(或负),但X与Y的回归系数却为负(或正),即相关系数与回归系数相反。”

对于这种情况,我们应该怎么办呢?

当然,必须承认的是,很多经济学实证研究中并不要求汇报相关系数;但也有一些期刊希望作者汇报在不控制任何变量的情况下X对Y的回归系数(相关系数)。

首先,要明确的是学者通过Tabluation表或Two way图展示X与Y之间存在正向或负向关系,但X对Y的影响是正还是负,我们仍然没有定论,因为虚假回归可能混淆学者的视线和判断。

那么,不免再次发问:对于这种相关系数与回归系数相反的情况,该怎么办呢?

审稿人不要求汇报相关系数还好,若要求汇报X与Y两者间的相关系数,那该如何是好?

针对这一问题,社群群友讨论了很多次(例如,X与Y负相关但回归系数却为正? OLS不显著但2SLS却显著?),有的说调一调数据,例如缩尾以剔除异常值,有的说通过VIF检查共线性问题,有的说看看控制变量有没有bad control问题,有的说直接汇报做出来的结果,以回归而非相关系数为准,不过要解释一下为什么会出现符号相反的情况。

最近,针对这一问题,社群群友分享了一篇发表在管理学TOP刊Strategic Management Journal上的文章(Emerging market firms' internationalization: how do firms' inward activities affect their outward activities?)。

他指出该篇文章就出现了相关系数为正,回归系数为负数的情况,但作者却将此反常现象作为一次秀创造力的机会。

作者认为,从X到Y的影响路径很多,有的可能为正向路径,而有的可能为负向路径,但最终可能是负向路径超过了正向路径,从而造成了X对Y的负向影响(审稿人: 能不能同时搞点X-Y的正向和负向影响机制?)。

下图显示两者回归系数显著为正。

接下来,关于X与Y的回归系数皆显著为负数。


一些社群学术讨论:1.“显著不显著的后背是什么, 非(半)参估计里解决内生性”,2.“计量社群里关于使用交互项还是中介效应分析开展机制研究的讨论”,3.“为啥面板数据回归中, 即使X对Y的解释程度很大, 但R-square一般都很小?”,4.多期DID中使用双向固定效应可能有问题! 又如何做平行趋势检验? 多期DID方法的最新进展如何?,5.收入和年龄等变量是将其转化成有序离散变量还是当成连续变量进行回归呢?6.控制变量就能影响结果显著性, 所以存在很大操作空间, 调参数是常用手段吗?7.回归中常数项显著说明模型中有遗漏变量问题?8.审稿人有义务告诉你回归中可能的遗漏变量么?9.针对很多实证问题的讨论, 随手保存的部分内容以飨学者,10.未引入交互项主效应为正, 引入后变为负, 解释出来的故事特别好, 主效应符号确实增强了故事性,11.双向固定效应多期DID最新进展和代码汇总, 关于控制变量和固定效应选取的讨论,12.逐年匹配的PSM-DID操作策略, 多时点panel政策评估利器,13.多期DID前沿方法大讨论, e.g., 进入-退出型DID, 异质性和动态性处理效应DID, 基期选择问题等,14.针对经济学领域中介效应模型问题的回应和理性讨论,15.讨论a(b)对b(a)的新方向论文, 经济学期刊分区问题, 3个机制存在时计量模型设计问题,16.如果解决了内生性, 那么是否意味着证实了变量之间的因果关系呢?17.解释变量提升一个标准差,被解释变量提升几个百分比呢?18.关于DID中对照组与处理组的比例问题?19.双重差分法和事件研究法的区别主要在哪里?20.双重差分法和事件研究法的区别主要在哪里?21.统计上不显著的变量表明该变量对结果变量没有影响吗?22.IV与Y在理论上无直接关系, 但用Y对IV做回归发现IV是显著的, 这是咋回事?23.Heckman模型和工具变量IV之间的差异?

一些前人经验帖,例如,1.经济学高质量论文(AER)写作"三步曲", 2万字宝贵干货,2.如何从审稿人角度写出一篇好的经济学文章?3.震撼回信! 邹恒甫教授回答中国中青年经济学者100问精选 (一),4.视频, 《计量经济学: 经济学实证研究方法论》,5.讲座视频: 模型内生性分类, 检验与处理,6.一个完整的实证分析框架: 从数据, 模型到结果检验,7.Katz&Goldin: TOP5刊上撰写论文的十个最重要的规则,8.顶级博士生如何开始经济学研究? 伦敦政治经济学院P.hd必读,9.用得好理论,你才能成为实证文章写作高手,10.经济学实证研究中常见的40个误区, 你掌握了可以发AER,11.实证经济学研究如何选题?前辈的总结和自己的实践经验,12.写论文的三个层次, 有-精-深环环相扣, 实在精彩!13.美国教授告诉你模型在微观实证研究中到底重不重要,14.芝加哥大学教授的经济学博士生论文写作指南,15.我是如何把文章发表到Top5期刊上的, 39点过来人的经验和教训!16.怎样用好最重要的几年? 给北大经济学研究生谈学习经验,17.22年诺奖得主Dybvig关于“做顶级经济学研究的一些经验想法”!18.5张Slides学习如何写高质量论文的各部分
拓展性阅读:"实证研究13篇"功夫秘笈, 中青年学者研究必备锦囊!关于各种因果识别方法的120份经典实证文献汇总”,②哈佛大学新修订完成的因果推断经典大作免费下载!附数据和code,③因果推断的统计方法总结, 177份文献政策评估的计量方法综述, 包括最新因果推断方法在教育领域使用IV, RDD, DID, PSM多吗? 使用具体文献,⑥看完顶级期刊文章后, 整理了内生性处理小册子,⑤工具变量精辟解释, 保证你一辈子都忘不了,⑦DID, 合成控制, 匹配, RDD四种方法比较, 适用范围和特征,⑧关于双重差分法DID的32篇精选Articles专辑!关于(模糊)断点回归设计的100篇精选Articles专辑!匹配方法(matching)操作指南, 值得收藏的16篇文章等,⑪MIT广为流传的政策"处理效应"读本,⑫DID的研究动态和政策评估中应用的文献综述,⑬最新政策效应评估的四种方法,⑭政策效应评估的基本问题,15.海归博导: 如果你想读我的博士生, 那请阅读并签署这份指导协议!16.TOP刊: 如果你找不到ideas,那就步行或淋浴吧

下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

4年,计量经济圈近1500篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle




数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 | 官员方言  | 微观数据 | 内部数据计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验计量经济圈组织了一个计量社群,有如下特征:热情互助最多前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存