R语言缺失值信息处理

mean(!is.na(mat))可以计算数据完整度(没有缺失值的)

mean(!is.na(mat))>0.9,90%完整可以使用

# 缺失值的位置研究
as.vector(attributes(na.omit(mat))$na.action)

which(rowSums(is.na(mat))!=0)

which(complete.cases(mat)==F)

 

# 缺失数据的图形可视化VIM包

library(VIM)

aggr(mat,numbers=T,prop= F)

matrixplot(mat)

# 相关性探索

mat

mat_NA<-mat[,which(complete.cases(t(mat))==F)]
mat_NA<-abs(is.na(mat_NA))
cor(mat_NA)

posted @ 2015-11-18 09:18  地表最强队队员  阅读(605)  评论(0编辑  收藏  举报