R语言 备忘录

  1. .Last.value 获取上一次结果值
  2. 产生等差序列用seq函数
  3. na.omit 函数可以返回一个去掉NA值的序列
  4. 获取一个dataset的行数可以用nrow函数
  5. 从一个数据集里去掉第21,23行,d<-d[-c(21,23), ]
  6. 有个函数叫 manyNAs , 可以从dataset里得到有较多 NA的行号。
  7. 在一个函数的参数列表中, 有一种参数用三个点表示, 它代表所有未命名参数的合集, 用于赋给内部的函数
  8. typeof函数得到具体的类型, mode得到一个宽泛的类型, class得到表示意义的类型
  9. dataframe[row, col] , dataframe[col], dataframe[whichi(col1=..),]
  10. 绘制一个空白的坐标轴plot(xrange,yrange,type='n')
  11. nrow 获取行数
  12. rm(list=ls())移除工作空间里所有的自定义变量
  13. save(x,y,z,file='x_y_z.filename') 保存变量
  14. unique函数能得到一个list,vector,dataframe的非重复元素, 类似sql中的select distinct
  15. df[which(complete.cases(df)==FALSE),] 可以返回所有带NA的行
  16. apply可以对某一个矩阵或dataframe的所有行或列应用一个函数, 而lapply 和 sapply 则会遍历他们的第一个参数,运行某一个function, lappy 返回list类型, sapply优先返回vector或matrix
  17. aggregate 完成类似sql中聚合函数和groupy by的工作
  18. hist 用于统计一个序列中各个元素的出现次数(频率)的, 而barplot则可以显示两个维度的元素的对应关系. 
  19. tapply可以实现类似aggregate的功能, 对一个vector进行聚类计算, 它的第二个参数叫INDEX,通常可以是一个list型或factor型, 这两个参数的length必须一致,以list型参数为例,它的序号和第一个参数vector对应, tapply会根据list的值来进行聚类, 例:
    l=list(c('class1','class2','class1'))
    tapply(1:3,l) #将1:3根据序号分组
    tapply(1:3,l,sum) #聚合

posted @ 2014-10-13 21:13  爱知菜  阅读(517)  评论(0编辑  收藏  举报