查看原文
其他

若系数回归结果不显著, 我们能够采取的方法和思路有哪些?

凡是搞计量经济的,都关注这个号了

箱:econometrics666@126.com

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

关于相关计量方法视频课程,文章,数据和代码,参看 1.面板数据方法免费课程, 文章, 数据和代码全在这里, 优秀学人好好收藏学习!2.双重差分DID方法免费课程, 文章, 数据和代码全在这里, 优秀学人必须收藏学习!3.工具变量IV估计免费课程, 文章, 数据和代码全在这里, 不学习可不要后悔!4.各种匹配方法免费课程, 文章, 数据和代码全在这里, 掌握匹配方法不是梦!5.断点回归RD和合成控制法SCM免费课程, 文章, 数据和代码全在这里, 有必要认真研究学习!6.空间计量免费课程, 文章, 数据和代码全在这里, 空间相关学者注意查收!7.Stata, R和Python视频课程, 文章, 数据和代码全在这里, 真的受用无穷!

正文

上日,分享了“回归系数与预期相反时, 我们能够采取的方法和思路有哪些?”,受到很多学人的欢迎;今天,继续分享一篇关于如何应对系数不显著的文章,希望能够给你带去一些启示。

Source: 数据分析,经管爱问

看JF、JFE、RFS上面的文章,实证结果总是相当地显著,不论作者采用何种思路做稳健性检验,都是怎么做怎么显著。这不得不让我深深地感到惊讶,他们是怎么做到的呢。
在我做实证的经历中,不显著是常态,显著反而稀缺。一般的论文或许我可以先放一放,继续push自己的idea。但博士论文实在是放不起,一不留神就快到毕业季了,再放一放,学位就不用拿了。因此面对种种不显著的挑战,只得想办法去解决它们。
实证结果不显著怎么办。
(1)选方程。同样的问题,有时会有不同的模型。某篇经典文献用的是A模型,另外一个大牛可能用的是B模型。倒底哪个模型更好,取决于你对模型背后理论的信念。如果你更认可A模型背后的理论,就用A模型;同理对B模型也是如此。而选择不同的模型时,得到的实证结果往往会存在差别。有时候差别仅仅体现在系数的大小上,而有时候差别体现在系数的显著性上。
(2)选变量。同一个财务变量,可能有多个指标能衡量。比如融资约束的度量,在文献经常出现的包括:公司规模、是否支付股利、产权性质、KZ指数、WW指数、信用评级、票据评级、利息偿付倍数、资产的可抵押能力、是否是集团公司等等。再比如掠夺风险的度量,包括:HHI、主营业务利润、价格-成本边际、超额价格-成本边际、勒纳指数、交叉弹性、熵指数、资本-劳动比偏离行业均值的绝对值、股票收益和行业组合收益的协方差、行业内最大四家企业的集中度等等。选择不同的指标衡量某个变量,得到的结果也存在差别。所以也可以采用这种思路来获得显著的结果。不过稳健性检验往往要求对某个无法精确度量的变量采取多种指标衡量,而且有时候还要检验这些指标的一致性(通过相关系数和交叉统计)。
(3)选样本。数据处理的过程包含了选择样本的过程。删除ST、PT公司,删除交叉上市的公司,删除IPO当年的数据,删除资不抵债的公司,对离群值进行Winsor处理。样本处理也是五花八门,值得细细琢磨一番。
(4)选方法。OLS、FE、GMM、3SLS、IV、Probit、DID,方法有很多,理论上可以改变不同的方法来做实证,但事实上每一种方法都有自己的限定条件和使用范围。所以选方法的可行性不太高。
上面所说的四种办法,其实更严格地来看,应该也是稳健性检验要做的工作。
首先,回归系数不显著不能简单滴认为对应的解释变量对被解释变量没有影响。先观察下F检验值,如果整体线性检验不显著,那么说明模型设定为线性不合适,需采用其他模型形式。如非线性回归模型。如果替代模型的回归系数t检验拒绝原假设(显著),那么说明是模型设定问题。再者,对残差进行异方差检验以及自相关检验,如果存在异方差或者自回归,则用广义OLS法消除后,再做参数显著性检验。异方差和自回归的存在均会使得t检验失效。如果仍然不显著,那么就要考虑是否将该变量从模型中剔除了。若剔除该变量后的回归结果使得三个信息准则值均下降,那么就该剔除该变量。
数据挖掘是一个技术活,一下子就显著的是不是要思考一下是不是伪回归的可能。不显著可能的原因很多,比如共线、变量度量的问题,样本的自选择偏误等等。如果实在需要显著的结果,有两个重要的方法,首先是看变量本身的度量,有没有其他度量的方法和调整的空间、比如楼上已经提到的融资约束的度量、分组的化哑变量的设置等等;另一个就是样本的选择和缺失值的处理,是替换成零(经济学上是否有意义),或者直接作为缺失删掉,这些都会显著的影响结果的显著程度甚至方向。当然,显著与否这些调整之后也许依然差的好远,那么就需要思考理论上是否成立了,或者是不是一个伪命题了。不显著就应该剔除,除非你想硬塞进这个自变量,那你只有改数据了要么剔除某些看起来就很跨装的数据,要么找个理由去掉常数项,你就会发现一下子就好显著啊。

下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

2.5年,计量经济圈近1000篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle




数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 | 官员方言  | 微观数据 | 内部数据计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验计量经济圈组织了一个计量社群,有如下特征:热情互助最多前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存