查看原文
其他

刚说完P for trend,SCI编辑又让算Per 1 SD,这又是啥东西!

松哥统计 精鼎统计 2023-06-15
导读

上次松哥给大家解读了P for trend是怎么回事,这不?又有人问,Per 1 SD又是咋回事?


有人说,我怎么没看过这样的文章,那让你看看吧!

文章标题:

The level of galactose-deficient IgA1 in the sera of patients with IgA nephropathy is associated with disease progression.


该文研究Gd-IgA1与IgA肾病的疾病进展的关系。作者本人并没有将原始测量的Gd-IgA1(U/ml)带入COX回归模型。而采用了两种变换的方式:

图1

1.Per 1 sd:

2.quarties:

精鼎SPSS全国研习班火爆报名中。。。。详情点击

精鼎38期SPSS全国研习班报名通知!

(长按下图识别报名,或点击阅读原文报名)









松哥统计说


1、quarties



看完9月3号的推送,松哥相信你已经能够看懂,为啥进行quarties进行统计分析。就是将原始数据进行四分位数间距分组,然后从小到大定义为1、2、3、4个等级。然而本文作者并没有做P for trend,而是把1、2、3、4当做无序分类,然后设置哑变量,以1为参照,得出具体的回归系数。


上次发文完,就有人问怎么实现,其实以前发过,链接如下:

如何让SPSS自动按照四分位数间距分组某变量【技巧】

2、Per 1 sd


Per 1 sd是指,原始数据每升高1个标准差,效应量发生的风险,本例为HR。可是这是怎么实现的呢?1个标准差是多少呢? 怎么实现这样的统计分析呢?


统计其实就是这样,看着很唬人,一旦告诉你,你就会说,哦!原来这么简单!像魔术一样,不知道答案认为很高深,知道答案,只会觉得自己智商低,被骗了!


Per 1 sd的实现,其实就是把原始数据进行标准化,另存为一个新的变量X,新变量X因为是被标准化后的数据,因此其均数和标准差为0和1。然后让x进入模型进行分析。请问大家此时x每增加1个单位,效应量增加的风险为HR。因为标准差为1,此时x增加1个单位,就是Per 1 sd。1=Per 1 sd。就是自变量每增加1个标准差。你明白了嘛?


此时,应该有掌声!!!!哈哈!


(画外音:别告诉我你不会标准化!)

3、松哥漫谈


知道别人怎么做的,说明文献能看懂了。而如果知道别人为什么这样做,那你就厉害了!因为这涉及到统计思维层面的东西了!而学习统计思维,最好还是跟着松哥喽!嘿嘿!


本例作者采用的统计描述指标的方法为:median(range),有点奇特,一般人家都是median(IQR)【中位数(四分位数间距)】,他却用中位数(极差)。一种可能是这家杂志要求的。另一种可能就是作者的数据变异程度太大,IQR无法掩盖其丑。


那为什么用median(range),因为数据不符合正态,于是作者还进行了一次ln变换(取对数),ln一般啥时候用呢,就是数据呈右偏态分布的时候。常见的数据有抗体滴度、菌落数、药物效价。本例确实为抗体滴度。作者采用ln变换,也体现了作者一定的严谨性;


lnGd-IgA1之后,数据呈现正态分布或近似正态分布,作者此时又进行标准化,再进行Per 1 sd分析的,完美解释!


看到此时,基本就结束了,愿意再受折磨的,咱们再来过过招!


4、松哥漫谈2


大家还记得上次讲的P for trend吧!那是将原始数据四分位数化,然后当做两种形式,一为等级,计算P for trend,二为无序分类:计算3个P,然后两个结果比较讨论!


本例是原始数据两种操作:一是标准变换,计算Per 1 sd;二是四分位数间距化,当做哑变量,计算3个P。


也就是提供了2种方案:Quarties+Per 1 sd;P for trend+Quarties;关键这两种方案如何进行选择呢?松哥也没有找到相关资料,大家若有请分享!


但基于目前的理解,松哥个人认为,资料可以挽救为正态分布,Per 1 sd会好些;而数据不就行正态变化或者无法正态变化,只进行四分位数分组,那就只能算P for trend。


但是,已经到了这个层面,我相信SCI编辑也差不多了吧!呵呵!




您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存