查看原文
其他

R语言和医学统计学系列(12):双变量回归与相关

阿越就是我 医学和生信笔记 2023-02-25

你们开工/开学了吗?

这是R语言和医学统计学的第12篇内容。

第1篇请见:R语言和医学统计学系列(1):t检验

第2篇请见:R语言和医学统计学系列(2):方差分析

第3篇请见:R语言和医学统计学系列(3):卡方检验

第4篇请见:R语言和医学统计学系列(4):秩和检验

第5篇请见:R语言和医学统计学系列(5):多因素方差分析

第6篇请见:R语言和医学统计学系列(6):重复测量方差分析

第7篇请见:R语言和医学统计学系列(7):多元线性回归

第8篇请见:R语言和医学统计学系列(8):logistic回归

第9篇请见:R语言和医学统计学系列(9):多重检验

第10篇请见:R语言和医学统计学系列(10):正态性和方差齐性检验

第11篇请见:R语言和医学统计学系列(11):球形检验

主要是用R语言复现课本中的例子。我使用的课本是孙振球主编的《医学统计学》第4版,封面如下:


今天主要是演示两变量相关的内容。

两样本相关

使用课本例9-5的数据。

df <- data.frame(
  weight = c(43,74,51,58,50,65,54,57,67,69,80,48,38,85,54),
  kv = c(217.22,316.18,231.11,220.96,254.70,293.84,263.28,271.73,263.46,276.53,341.15,261.00,213.20,315.12,252.08)
)

str(df)
## 'data.frame': 15 obs. of  2 variables:
##  $ weight: num  43 74 51 58 50 65 54 57 67 69 ...
##  $ kv    : num  217 316 231 221 255 ...

两变量是否有关联?其方向和密切程度如何?

cor.test(~ weight + kv, data = df)
## 
##  Pearson's product-moment correlation
## 
## data:  weight and kv
## t = 6.5304, df = 13, p-value = 1.911e-05
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  0.6584522 0.9580540
## sample estimates:
##       cor 
## 0.8754315

从结果可以看出,两者是正相关,相关系数r = 0.8754,且p痔小于0.05,具有统计学意义!

可视化结果:

library(ggplot2)

ggplot(df, aes(weight, kv)) +
  geom_point(size = 2) +
  geom_smooth(method = "lm") +
  theme_minimal()
## `geom_smooth()` using formula 'y ~ x'

相关性分析的过程比较简单,在选择方法时要注意是使用pearson相关还是秩相关。



以上就是今天的内容,希望对你有帮助哦!欢迎点赞、在看、关注、转发

欢迎在评论区留言或直接添加我的微信!


END


往期精彩内容:

超详细的R语言热图之complexheatmap系列1


超详细的R语言热图之complexheatmap系列2


超详细的R语言热图之complexheatmap系列3


R语言生信图表学习之网络图


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存