visdat模块 图形化展示数据的结构与缺失值

今天介绍一个简单、实用的R模块{visdat},可以将数据的结构以及缺失值(R语言精要-缺失值篇)以作图的方式展现,帮助迅速的了解数据的大概情况,尤其是令人头疼的缺失值!
1.安装和载入R包
install.packages("visdat")
library(ggplot2) # 使用到里面的一个数据“msleep”
library(visdat)
2. 查看数据
首先查看一下数据:
直接展示原始数据集
msleep

上述的数据是以tibble(一文读懂dataframe与tibble之间的异同点!)的形式保存,含有83行×11列,上述的NA指的是缺失值。
这里只显示了数据的前10行,剩余的73行没有显示。
3. 将整体的数据结构和缺失值进行作图
只需一行代码:
vis_dat(msleep)

结果非常惊艳!
上图将“msleep”的结构完美展示出来:左侧为数据的行数(observations),上方为各个变量名称(列)。并且标注了各个变量的类型,如西瓜红指的是字符型变量(character),而蓝绿色的为数值型变量(numeric),灰色的为缺失值(NA,not available)。
4. 只专注于缺失值的呈现
也是一行搞定:
vis_miss(msleep)

黑色指代缺失值,灰色指代没有缺失值,并且贴心的标注了缺失值的百分比!
只需记住两个函数:vis_dat()和vis_miss()。
浙公网安备 33010602011771号