韦恩图进阶！upset plot 04

Original 阿越就是我医学和生信笔记 2023-06-15

收录于合集

#韦恩图 13 个

#R包学习 73 个

#r可视化 115 个

关注公众号，发送R语言或Python，获取学习资料！

Try to learn everything about something!

书接上回！！！

前面讲了组合图形，今天继续组合！

前面的组合图形都是关于交集的，或者关于总体的一些统计汇总可视化，今天说的metadata是关于每个集合的属性。

还是以movies数据集为例。

“
自带数据集movies，是一个电影类型数据，共有3883行（3881部电影），21列。第1列是电影名字，还有上映时间（ReleaseDate）、评分（AvgRatings）、观看数（Watches）。其余列是由0-1矩阵表示的电影类型。

movies <- read.csv(system.file("extdata", "movies.csv", package = "UpSetR"), 
    header = T, sep = ";")

str(movies)
## 'data.frame': 3883 obs. of  21 variables:
##  $ Name       : chr  "Toy Story (1995)" "Jumanji (1995)" "Grumpier Old Men (1995)" "Waiting to Exhale (1995)" ...
##  $ ReleaseDate: int  1995 1995 1995 1995 1995 1995 1995 1995 1995 1995 ...
##  $ Action     : int  0 0 0 0 0 1 0 0 1 1 ...
##  $ Adventure  : int  0 1 0 0 0 0 0 1 0 1 ...
##  $ Children   : int  1 1 0 0 0 0 0 1 0 0 ...
##  $ Comedy     : int  1 0 1 1 1 0 1 0 0 0 ...
##  $ Crime      : int  0 0 0 0 0 1 0 0 0 0 ...
##  $ Documentary: int  0 0 0 0 0 0 0 0 0 0 ...
##  $ Drama      : int  0 0 0 1 0 0 0 0 0 0 ...
##  $ Fantasy    : int  0 1 0 0 0 0 0 0 0 0 ...
##  $ Noir       : int  0 0 0 0 0 0 0 0 0 0 ...
##  $ Horror     : int  0 0 0 0 0 0 0 0 0 0 ...
##  $ Musical    : int  0 0 0 0 0 0 0 0 0 0 ...
##  $ Mystery    : int  0 0 0 0 0 0 0 0 0 0 ...
##  $ Romance    : int  0 0 1 0 0 0 1 0 0 0 ...
##  $ SciFi      : int  0 0 0 0 0 0 0 0 0 0 ...
##  $ Thriller   : int  0 0 0 0 0 1 0 0 0 1 ...
##  $ War        : int  0 0 0 0 0 0 0 0 0 0 ...
##  $ Western    : int  0 0 0 0 0 0 0 0 0 0 ...
##  $ AvgRating  : num  4.15 3.2 3.02 2.73 3.01 3.88 3.41 3.01 2.66 3.54 ...
##  $ Watches    : int  2077 701 478 170 296 940 458 68 102 888 ...

这个数据一共21列，其中4列是属性，剩余17列是电影类型，例如动作片、剧情片、恐怖片、惊悚片等。

下面我们新建一个数据集，这个数据集是每种类型电影的烂番茄评分！

metadata <- data.frame(
  sets = names(movies[3:19]),
  RottenTomato = round(runif(17, min = 0, max = 90))
)

upset(movies, 
      set.metadata = list(
        data = metadata, 
        plots = list(list(type = "hist", column = "RottenTomato", assign = 20))
        )
      )

plot of chunk unnamed-chunk-17

OK，非常简单就显示了每种类型电影的烂番茄评分，以条形图的形式展示在最左侧。

当然也可以是其他类型的图形，比如热图。

# 再新建一个数据画热图用
metadata$Cities <- sample(c("Boston", "NYC", "LA"), 17, replace = T)
metadata$accepted <- round(runif(17, min = 0, max = 1))
str(metadata)
## 'data.frame': 17 obs. of  4 variables:
##  $ sets        : chr  "Action" "Adventure" "Children" "Comedy" ...
##  $ RottenTomato: num  84 79 66 43 13 26 74 54 70 25 ...
##  $ Cities      : chr  "Boston" "Boston" "NYC" "Boston" ...
##  $ accepted    : num  0 0 0 1 0 0 1 1 0 0 ...

upset(movies, 
      set.metadata = list(
        data = metadata, 
        plots = list(
          list(type = "heat", column = "Cities", assign = 10, colors = c(Boston = "green", NYC = "navy", LA = "purple")),
          list(type = "heat", column = "RottenTomato", 
    assign = 10),
    list(type = "bool", 
    column = "accepted", assign = 5, colors = c("#FF3333", "#006400"))
          )
        )
      )

plot of chunk unnamed-chunk-19

还可以是文字，甚至把下方的矩阵换一个颜色：

upset(movies, 
      set.metadata = list(
        data = metadata, 
        plots = list(
          list(type = "text", column = "Cities", assign = 10, colors = c(Boston = "tomato", NYC = "grey70", LA = "red")),
          list(type = "matrix_rows", column = "Cities", colors = c(Boston = "green", NYC = "navy", LA = "purple"), 
    alpha = 0.5)
          )))

plot of chunk unnamed-chunk-20

OK，以上就是upset plot的全部内容！一共分了4篇推文介绍，这个包真是666！

最后，给大家奉上完整的upset plot：

upset(movies, main.bar.color = "skyblue",
      
      set.metadata = list(
        data = metadata, 
        plots = list(
          list(type = "hist", column = "RottenTomato", assign = 20), 
          list(type = "bool", column = "accepted", assign = 5, colors = c("#FF3333", "#006400")), 
          list(type = "text", column = "Cities", assign = 5, colors = c(Boston = "green", NYC = "navy", LA = "purple")), 
          list(type = "matrix_rows", column = "Cities", colors = c(Boston = "green", NYC = "navy", LA = "purple"), alpha = 0.5)
          )
        ), 
      
      queries = list(
        list(query = intersects, params = list("Drama"), color = "red", active = F),
        list(query = intersects, params = list("Action", "Drama"), active = T), 
        list(query = intersects, params = list("Drama", "Comedy", "Action"), color = "orange", active = T)
        ), 
      
      attribute.plots = list(
        gridrows = 45, 
        plots = list(
          list(plot = scatter_plot, x = "ReleaseDate", y = "AvgRating", queries = T),
          list(plot = scatter_plot, x = "AvgRating", y = "Watches", queries = F)
          ), 
        ncols = 2),
      
      query.legend = "bottom")

plot of chunk unnamed-chunk-21

最后，希望对大家有帮助哦！

以上就是今天的内容，希望对你有帮助哦！欢迎点赞、在看、关注、转发！

欢迎在评论区留言或直接添加我的微信！

完

欢迎关注公众号：医学和生信笔记

“
医学和生信笔记 公众号主要分享：1.医学小知识、肛肠科小知识；2.R语言和Python相关的数据分析、可视化、机器学习等；3.生物信息学学习资料和自己的学习笔记！

往期回顾

让你的ggplot2主题支持markdown和css

让你的ggplot2支持markdown语法

让OneNote支持Markdown：oneMark，重新定义OneNote

ggpairs展示数据间的相关性

R语言和医学统计学（合辑）

抗洪靠嘴，堵漏靠沙？印度官员真是绝了！

这样的洞庭湖决堤，实在让人同情不起来

有的人走了，却永远活着

圈内疯传某谣言

不要放过这些人渣

韦恩图进阶！upset plot 04

您可能也对以下帖子感兴趣

抗洪靠嘴，堵漏靠沙？印度官员真是绝了！

这样的洞庭湖决堤，实在让人同情不起来

有的人走了，却永远活着

圈内疯传某谣言

不要放过这些人渣

生成图片，分享到微信朋友圈

韦恩图进阶！upset plot 04

您可能也对以下帖子感兴趣