R语言数据框中,用0替代NA缺失值

1、用0替代数据框中的缺失值NA

生成数据框:

复制代码
> m <- matrix(sample(c(NA, 1:10), 100, replace = TRUE), 10)
> d <- as.data.frame(m)
   V1 V2 V3 V4 V5 V6 V7 V8 V9 V10
1   4  3 NA  3  7  6  6 10  6   5
2   9  8  9  5 10 NA  2  1  7   2
3   1  1  6  3  6 NA  1  4  1   6
4  NA  4 NA  7 10  2 NA  4  1   8
5   1  2  4 NA  2  6  2  6  7   4
6  NA  3 NA NA 10  2  1 10  8   4
7   4  4  9 10  9  8  9  4 10  NA
8   5  8  3  2  1  4  5  9  4   7
9   3  9 10  1  9  9 10  5  3   3
10  4  2  2  5 NA  9  7  2  5   5
复制代码

替代数据框中的缺失值

复制代码
> d[is.na(d)] <- 0

> d
   V1 V2 V3 V4 V5 V6 V7 V8 V9 V10
1   4  3  0  3  7  6  6 10  6   5
2   9  8  9  5 10  0  2  1  7   2
3   1  1  6  3  6  0  1  4  1   6
4   0  4  0  7 10  2  0  4  1   8
5   1  2  4  0  2  6  2  6  7   4
6   0  3  0  0 10  2  1 10  8   4
7   4  4  9 10  9  8  9  4 10   0
8   5  8  3  2  1  4  5  9  4   7
9   3  9 10  1  9  9 10  5  3   3
10  4  2  2  5  0  9  7  2  5   5
复制代码

2、用0替代变量中的缺失值

x <- c(1,2,NA,4,5)
x[is.na(x)] <- 0

 3. 不仅仅是0,同理你还可以赋予其他的数值

R语言用complete.cases 和 na.omit去除有空值的行

下面用实例来说明这两个函数的作用:

这是一个数据框final:
  gene hsap mmul mmus rnor cfam  
 1 ENSG00000208234 0 NA NA NA NA  
 2 ENSG00000199674 0 2 2 2 2  
 3 ENSG00000221622 0 NA NA NA NA  
 4 ENSG00000207604 0 NA NA 1 2  
 5 ENSG00000207431 0 NA NA NA NA  
 6 ENSG00000221312 0 1 2 3 2
如果要去除有NA的行,则可用:
final[complete.cases(final),] 
也可用 na.omit(final)
那么,返回值是

   gene hsap mmul mmus rnor cfam  
 2 ENSG00000199674 0 2 2 2 2  
 6 ENSG00000221312 0 1 2 3 2
现在,我只想过滤部分列:
我们就只能用
final[complete.cases(final[,5:6]),]
结果是:


   gene hsap mmul mmus rnor cfam  
 2 ENSG00000199674 0 2 2 2 2  
 4 ENSG00000207604 0 NA NA 1 2  
 6 ENSG00000221312 0 1 2 3 2
这样第四行含有空值,但是,我们的命令是只过滤第5列,第6列中含有NA的行

 

 

posted @ 2018-03-20 09:00  Timechancer  阅读(7167)  评论(0编辑  收藏  举报