R语言数据框中，用0替代NA缺失值

1、用0替代数据框中的缺失值NA

生成数据框：

> m <- matrix(sample(c(NA, 1:10), 100, replace = TRUE), 10)
> d <- as.data.frame(m)

   V1 V2 V3 V4 V5 V6 V7 V8 V9 V10
1   4  3 NA  3  7  6  6 10  6   5
2   9  8  9  5 10 NA  2  1  7   2
3   1  1  6  3  6 NA  1  4  1   6
4  NA  4 NA  7 10  2 NA  4  1   8
5   1  2  4 NA  2  6  2  6  7   4
6  NA  3 NA NA 10  2  1 10  8   4
7   4  4  9 10  9  8  9  4 10  NA
8   5  8  3  2  1  4  5  9  4   7
9   3  9 10  1  9  9 10  5  3   3
10  4  2  2  5 NA  9  7  2  5   5

替代数据框中的缺失值

> d[is.na(d)] <- 0

> d
   V1 V2 V3 V4 V5 V6 V7 V8 V9 V10
1   4  3  0  3  7  6  6 10  6   5
2   9  8  9  5 10  0  2  1  7   2
3   1  1  6  3  6  0  1  4  1   6
4   0  4  0  7 10  2  0  4  1   8
5   1  2  4  0  2  6  2  6  7   4
6   0  3  0  0 10  2  1 10  8   4
7   4  4  9 10  9  8  9  4 10   0
8   5  8  3  2  1  4  5  9  4   7
9   3  9 10  1  9  9 10  5  3   3
10  4  2  2  5  0  9  7  2  5   5

2、用0替代变量中的缺失值

x <- c(1,2,NA,4,5)
x[is.na(x)] <- 0

3. 不仅仅是0，同理你还可以赋予其他的数值

R语言用complete.cases 和 na.omit去除有空值的行

下面用实例来说明这两个函数的作用：

这是一个数据框final：

  gene hsap mmul mmus rnor cfam

 1 ENSG00000208234 0 NA NA NA NA

 2 ENSG00000199674 0 2 2 2 2

 3 ENSG00000221622 0 NA NA NA NA

 4 ENSG00000207604 0 NA NA 1 2

 5 ENSG00000207431 0 NA NA NA NA

 6 ENSG00000221312 0 1 2 3 2

如果要去除有NA的行，则可用：

final[complete.cases(final),]

也可用 na.omit(final)

那么，返回值是

   gene hsap mmul mmus rnor cfam

 2 ENSG00000199674 0 2 2 2 2

 6 ENSG00000221312 0 1 2 3 2

现在，我只想过滤部分列：

我们就只能用

final[complete.cases(final[,5:6]),]

结果是：

   gene hsap mmul mmus rnor cfam

 2 ENSG00000199674 0 2 2 2 2

 4 ENSG00000207604 0 NA NA 1 2

 6 ENSG00000221312 0 1 2 3 2

这样第四行含有空值，但是，我们的命令是只过滤第5列，第6列中含有NA的行

posted @ 2018-03-20 09:00 Timechancer 阅读(7306) 评论(0) 收藏举报

刷新页面返回顶部

R语言数据框中，用0替代NA缺失值

R语言用complete.cases 和 na.omit去除有空值的行

公告