表格转换,多行聚集成列,长列转换成多行

 

我从中学开始就立体,较多维的数据理解不强,所以这部分进度慢些很正常

R ggplot2绘图常用一维数据列表的数据框,所以常用到多行聚为列这个功能。

减列数,减维:

常用包:reshape2,tidyr以及聚集了tidyr等包的tidyverse。

创建例子df<-data.frame(x=c("A","B","C"),"2010"=c(1,3,4),'2011'=c(3,5,2),check.names=FALSE)

 

reshap2::melt(数据框,id.var=索引列,variable.name=转换后列变量名的列名,value.name=转换后变量对应值的列名)

#id.vars 是被当做维度的列变量,每个变量在结果中占一列;(measure.vars 是被当成观测值的列变量),列变量名称和值分别组成 variable 和 value两列,

#"value": it is the actual data or instructions stored in computer.

#A variable is just a name that stands for a value in a certain scope of the program

 

> df_melt<-reshape2::melt(df,id.var="x",variable.name="year",value.name="value")

tidyr::gather(数据框,转换后列变量名的列名,转换后变量对应值的列名,-索引列)

注:-索引列是指除索引列其他都聚合。

> df_gather<-tidyr::gather(df,year,value,-x)

 >df_gather<-tidyr::gather(df,year,value,2:3) #指定要聚合的列

上面三函数运行结果相同:

 

 

加列数,加维 

reshape2::dcast(数据框,行标签~列标签,value.var=列对应的值)   注:这里行标签指第一列自变量标签

reshape2::dcast(df_melt,x~year,value.var = "value")

tidyr::spread(数据框,待转的列标签,对应的值)

df_spread<-tidyr::spread(df_gather,year,value)

 

 备注:tidyverse是Hadley创建的R包的集合。核心软件包是ggplot2,dplyr,tidyr,readr,purrr,tibble,stringr和forcats。其中readr用于读取数据,tidyr用于整理数据,dplyr用于数据转换,ggplot2用于数据可视化,purrr用于函数式编程。

posted on 2021-10-01 10:42  BioinformaticsMaster  阅读(73)  评论(0编辑  收藏  举报

导航