R语言 备忘录
- .Last.value 获取上一次结果值
- 产生等差序列用seq函数
- na.omit 函数可以返回一个去掉NA值的序列
- 获取一个dataset的行数可以用nrow函数
- 从一个数据集里去掉第21,23行,d<-d[-c(21,23), ]
- 有个函数叫 manyNAs , 可以从dataset里得到有较多 NA的行号。
- 在一个函数的参数列表中, 有一种参数用三个点表示, 它代表所有未命名参数的合集, 用于赋给内部的函数
- typeof函数得到具体的类型, mode得到一个宽泛的类型, class得到表示意义的类型
- dataframe[row, col] , dataframe[col], dataframe[whichi(col1=..),]
- 绘制一个空白的坐标轴plot(xrange,yrange,type='n')
- nrow 获取行数
- rm(list=ls())移除工作空间里所有的自定义变量
- save(x,y,z,file='x_y_z.filename') 保存变量
- unique函数能得到一个list,vector,dataframe的非重复元素, 类似sql中的select distinct
- df[which(complete.cases(df)==FALSE),] 可以返回所有带NA的行
- apply可以对某一个矩阵或dataframe的所有行或列应用一个函数, 而lapply 和 sapply 则会遍历他们的第一个参数,运行某一个function, lappy 返回list类型, sapply优先返回vector或matrix
- aggregate 完成类似sql中聚合函数和groupy by的工作
- hist 用于统计一个序列中各个元素的出现次数(频率)的, 而barplot则可以显示两个维度的元素的对应关系.
- tapply可以实现类似aggregate的功能, 对一个vector进行聚类计算, 它的第二个参数叫INDEX,通常可以是一个list型或factor型, 这两个参数的length必须一致,以list型参数为例,它的序号和第一个参数vector对应, tapply会根据list的值来进行聚类, 例:
l=list(c('class1','class2','class1')) tapply(1:3,l) #将1:3根据序号分组 tapply(1:3,l,sum) #聚合