查看原文
其他

医学统计方法的R语言实现v2022

阿越就是我 医学和生信笔记 2023-06-15
关注公众号,发送R语言python,可获取资料

💡专注R语言在🩺生物医学中的使用


免费千人🐧QQ交流群:613637742


使用R语言进行医学统计分析是我学习R语言的初衷,所以医学统计方法的R语言实现一直本号的重要内容之一,通过整理这些推文,也确实让我进步颇多!

本篇是对过去1年中,所有介绍过的医学统计方法的推文汇总。最开始想叫医学统计方法的R语言实现大全,但仔细想想,这些不过是九牛一毛,现在就叫大全,太不符合实际了!

所以就叫医学统计方法的R语言实现v2022,这是一个阶段性的终点,同时也是一个起点,以后还会有v2023/v2024...

我最开始学习时用的是笨方法,每一行代码都是我一个字母一个字母敲上去的,每一个数据都是我一个数字一个数字录进去的,后来随着学习的深入,才学会了直接读取不同格式的数据,不用自己录入数据了。所以前期的推文看上去代码略显笨拙,这些都是学习的痕迹!

首先是梦开始的地方,一些常见的基础统计分析方法,比如t检验、方差分析、秩和检验、卡方检验、线性回归、logistic回归等,这部分内容很简单,SPSS也能很好的完成,对初学者来说甚至SPSS更简单,这部分所有的内容,我都是对照孙振球第4版医学统计学中的例题进行的,因为对初学者来说,使用其他数据很难判断自己做的到底对不对!书籍电子版和配套数据也都放在了QQ群中,方便大家下载使用。

R语言和医学统计学系列(1):t检验

R语言和医学统计学系列(2):方差分析

R语言和医学统计学系列(3):卡方检验

R语言和医学统计学系列(4):秩和检验

R语言和医学统计学系列(5):多因素方差分析

R语言和医学统计学系列(6):重复测量方差分析

R语言和医学统计学系列(7):多元线性回归

R语言和医学统计学系列(8):logistic回归

R语言和医学统计学系列(9):多重检验

R语言和医学统计学系列(10):正态性和方差齐性检验

R语言和医学统计学系列(11):球形检验

R语言和医学统计学系列(12):双变量回归与相关

R语言和医学统计学:非参数检验的补充

非参数检验的全能R包:PMCMRplus

R语言和医学统计学系列:协方差分析

R语言和医学统计学系列:样本量计算

以上是base r实现的医学统计方法,但是缺点很明显,一次只能检验1个变量,不如SPSS简单灵活,比如我同时收集一群人的身高、体重、BMI、血糖,分为对照组和实验组,在SPSS中可以轻松对多个变量同时比较不同组的差异,在R中就要写循环,对于初学者来说,写循环显然不是一个好的选择,所以又接着介绍了tidy风格的实现方法,不用写循环也能同时对多个变量进行检验了,真的是很方便:

R语言tidy风格医学统计学

R语言tidy风格医学统计学02

R语言多个变量同时进行t检验、方差分析等

后来随着学习的不断深入,我对前面几篇内容进行了简单的整理,主要是多重比较、卡方检验、方差分析部分,并增加了一些新的内容,特别是方差分析部分,涵盖了孙振球第4版医学统计学中关于方差分析的所有内容!这些让我受益匪浅,尤其是重复测量的方差分析

R语言多个样本均数的多重比较

R语言非参数检验后的多重比较

R语言重复测量数据的多重比较

R语言卡方检验方法总结

R语言线性趋势检验:Cochran Armitage 检验

R语言方差分析总结

R语言方差分析的注意事项

接下来是学习logistic回归的各种类型以及判别分析实现方法,并通过学习这部分内容,了解了分类变量进行回归分析的各种编码方案,比如哑变量编码、simple coding、deviation coding、正交多项式编码、helmert coding等,这些知识不是仅限于R语言,在SPSS、SAS、Stata等软件中,都是类似的编码方式!对于理解回归系数和常数项的计算有非常大的帮助。

R语言logistic回归的细节解读

R语言多项逻辑回归-因变量是无序多分类

R语言有序logistic回归-因变量为等级资料

R语言条件(配对)逻辑回归-因变量是配对资料

分类变量进行回归分析时的编码方案

R语言判别分析

对相关性分析也补充了偏相关、半偏相关、典型相关的内容,并介绍了一些绘图方法:

R语言偏相关和典型相关分析


到这里为止,是一个很明显的分水岭,阅读量差异很大...可能以上内容确实有些简单,而且和SPSS相比确实没有明显的优势。

以下的内容因为涉及到一些花里胡哨的可视化方法,这方面SPSS确实相形见绌,比R差远了。

首先是聚类分析、主成分分析、因子分析,以及它们的可视化方法,其中主成分分析的可视化这篇,是我目前阅读量最高的一篇,看来大家对美的追求都是相似的...

R语言聚类分析(1)

R语言聚类分析可视化(2)

又是聚类分析可视化!

R语言可视化聚类树

R语言画好看的聚类树

R语言主成分分析

R语言主成分分析可视化(颜值高,很详细)

R语言PCA可视化3D版

使用R语言美化PCA图

R语言因子分析

ROC曲线这部分是我写推文最多的一部分内容,关于各种各样的ROC曲线,分类资料的、生存资料的、最佳截点、平滑曲线、可信区间、ROC曲线比较等,全部包括了,真的是非常全,但是以后可能还是会有相关的内容。

R语言画多时间点ROC和多指标ROC曲线

临床预测模型之二分类资料ROC曲线绘制

临床预测模型之生存资料的ROC曲线绘制

生存资料ROC曲线的最佳截点和平滑曲线

ROC(AUC)曲线的显著性检验

ROC阳性结果还是阴性结果?

ROC曲线纯手工绘制

R语言计算AUC(ROC曲线)的注意事项

多指标联合诊断的ROC曲线

接下来是大家非常感兴趣的部分:生存分析。这部分内容在临床中也是非常常用的内容,所以我写的很详细,从简单到复杂,寿命表、K-M法、Cox回归、竞争风险模型、以及相关的可视化方法都进行了详细的介绍,很多东西,确实是之前不怎么注意的,比如不满足等比例风险假设时,应该怎么处理?除此之外,在生信数据挖掘中也经常用到生存分析,不过目前批量生存分析还没介绍,后面会抽空补上。

R语言生存分析的实现

R语言生存分析:Cox回归

R语言时依系数和时依协变量Cox回归

R语言生存曲线的可视化(超详细)

Fine-Gray检验、竞争风险模型、列线图绘制

除此之外,还介绍了一些控制混杂的方法,以及一些文献中常见的指标的实现,有些方法在临床中用的不多,可能更加偏向于流行病学、预防医学方面,所以这部分也是浅尝辄止,只是介绍了一些皮毛,不过没想到大家竟然很喜欢!

R语言倾向性评分:匹配

R语言倾向性评分:回归和分层

R语言倾向性评分:加权

p for trend/ p for interaction/ per 1 sd 的R语言实现

接下来介绍的这部分内容我觉得非常重要,主要就是单因素分析和多因素分析的关系,想必大家经常遇到先进行单因素分析,有意义的继续进行多因素分析,这种情况对吗?有什么道理吗?为什么有的变量在单因素分析是保护因子,到了多因素就变成了危险因子? 让我来说我是说不明白的,所以特地转载统计学大佬冯国双老师的几篇推文,让大家彻底搞清楚其中的原理。一共4篇推文,值得大家仔细阅读!

为什么单因素分析和多因素分析的结果不一样?

“先做单因素,有意义的做多因素”——这种思路对吗?

“先做单因素,有意义的做多因素”——要不要这种思路?

单因素分析到底有没有必要做?

最后一部分学习了一下R语言中的非线性拟合的实现方法,主要是限制性立方样条和多项式回归,这些方法也是近期用的逐渐多起来,可能和最近数据库挖掘的火爆有关。这些都是非线性拟合的内容,所以放在一起介绍,首先还是介绍非线性拟合的基本概念,为什么要使用非线性拟合,样条回归和非线性拟合的关系,然后逐渐过渡到R语言实现。

样条回归(之一)——为什么要用样条回归

样条回归(之二)——样条回归通俗介绍

R语言非线性拟合之多项式回归

R语言限制性立方样条回归


OK,以上就是医学统计学部分2022年的全年总结,内容不少,有简单的也有复杂的,基本能涵盖临床中常见的统计方法。不过更多是偏向于如何使用R语言实现。

以后的医学统计相关的推文将会继续给大家带来更多内容的解释、细节的解读、多种方法的比较、结果的可视化等,如果大家有比较感兴趣的内容,也欢迎留言或私信。

2022完结撒花✿✿ヽ(°▽°)ノ✿

最后,祝大家新的一年心想事成,万事顺利!




免费千人🐧QQ交流群:613637742


🔖精选合集



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存