R语言基础-数据转换

##一、基本转换
###读取Excel数据


methods(is) 函数可以查看所有 is 的方法。用于判断数据
methods(as) 函数可以查看所有的转换方法。

##二、对大数据集,取数据子集
###1.读数据



####两种写法


###2.随机抽样函数 sample()
####对向量抽样

####对数据框抽样,取子集

###3.删除特定数据
####原数据 mtcars

####删除1-5列

####删除mpg列

###4.合并不同的数据集
####美国50个州的数据

####每个周的分区

####合并后的数据集

或者

####合并前20行和后20行

###注意:
使用 cbind() 和 rbind() 函数合并矩阵时必须要有相同的行和列数
###5.去除重复行
####使用 duplicated() 函数判断是否为重复值

####使用 unique() 函数直接对数据集去重

##三、数据框的翻转
####使用 t() 函数对mtcars数据进行行和列的翻转

####使用 rev() 函数实现向量倒置

####通过翻转数据框索引的方式实现 women 数据的翻转

##四、数据框数据的替换
####使用 transform() 函数修改列的值


#####或者
women$height ← women$height*2.54

##五、数据框的排序
###1.sort() 函数,对向量进行排序


####通过列名对数据框排序

###2.order() 函数,也可对向量进行排序,不过返回的值是索引

####对mtcars数据框中的mpg列进行排序

#####反排

#####对多个列进行排序

##六、对数据框进行运算
###1.apply() 函数,用于数据框或者矩阵

####lapply() 函数,运算后返回的值是列表
####sapply() 函数,运算后的值返回的是向量
使用state.center 列表数据

####tapply() 函数,第二个参数是因子
#####查看区域有多少个州

##七、数据的去中心化和去标准化处理,消除量纲对数据结构的影响
####数据中心化:
指数据集中的各项数据减去数据集的均值
####数据标准化:
指在中心化之后再除以数据集的标准差,即数据集中的各项数据减去数据集的均值再除以数据集的标准差。

###1.案例,对 state.x77 数据绘制热图
heatmap(state.x77)
####非常的不明显,没有意义

###2.使用scale() 函数,实现去中心化和去标准化

posted @ 2020-05-11 23:29  旭东东  阅读(4119)  评论(0编辑  收藏  举报