查看原文
其他

visdat包:助你一眼看穿数据结构和缺失值!

R师傅 庄闪闪的R语言手册 2022-10-25

点击下方公众号,回复资料分享,收获惊喜

全文900字,预计阅读时间3min

简介

今天介绍一个简单、实用的visdat[1]包,可以将数据的结构以及缺失值(R语言精要-缺失值篇(可跳转))以作图的方式展现,帮助迅速的了解数据的大概情况,尤其是令人头疼的缺失值!

教程

1. 安装和载入R包

install.packages("visdat")
library(visdat)
library(ggplot2)   # 使用到里面的一个数据“msleep”library(visdat)

2. 查看数据

首先查看一下数据:

# 直接展示原始数据集
msleep

上述的数据是以tibble(一文读懂dataframe与tibble之间的异同点!(可跳转))的形式保存,含有83行×11列,上述的NA指的是缺失值。这里只显示了数据的前10行,剩余的73行没有显示。

3. 将整体的数据结构和缺失值进行作图

只需一行代码即可获得整体数据结构和缺失值相关图

vis_dat(msleep)

结果非常惊艳!上图将“msleep”的结构完美展示出来:左侧为数据的行数(observations),上方为各个变量名称(列)。并且标注了各个变量的类型,如西瓜红指的是字符型变量(character),而蓝绿色的为数值型变量(numeric),灰色的为缺失值(NA,not available)。

4. 只专注于缺失值的呈现

也是一行搞定:

vis_miss(msleep)

黑色指代缺失值,灰色指代没有缺失值,并且贴心的标注了缺失值的百分比!

:所以如果你想对数据缺失值进行可视化,只需记住两个函数:vis_dat()vis_miss()即可。操作非常简单,可以尝试使用到自己的数据集中。

参考资料

[1]

visdat: https://github.com/ropensci/visdat


推荐:可以保存以下照片,在b站扫该二维码,或者b站搜索【庄闪闪】观看R可视化系列视频教程。


相关推荐

R可视乎 | 双变量映射地图绘制


R可视乎|克利夫兰点图系列


R可视乎|棒棒糖图


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存