R语言-实用功能性语句1

		# options(digits= ),digits后面的参数为1至22的数字，默认为7。
		# options函数还可以改变很多全局选项，如更改提示符(prompt)，
		# 是否显示错误信息(show.error.messages)等。
		options(digits = 5)
		options(warn = 1)

5)R工作目录的设置

		# 使用getwd()命令获得R的工作目录(Working Directory)
		getwd() 
		# 使用setwd()设置工作目录位置
		setwd()
		# 可视化设置目录
		choose.dir()
		# 获取当前执行R文件所在目录
		dirname(file.path("","p1","p2","p3","filename"))
		# 删除所有的路径，包括最后一个路径分隔符
		basename(file.path("","p1","p2","p3", c("file1", "file2")))

6)当R启动后，R在内存中会自动加载若干Package|R初始状态载入包列表

		stats     | 常用统计函数
		graphics  | 基础绘图函数
		grDevices | 基础或grid图形设备
		utils     | R工具函数
		datasets  | 基础数据集
		methods   | 用于R对象和编程工具的方法和类的定义
		base      | 基础函数

7)保存自己的工作

		# 它将在R的起始目录保存记忆区（working space）至.RData文件
		save.image()   
		# 保存需要保存的R对象
		save(…,file = )

8)查看函数的代码

		# 如何得到函数的代码，通常情况你只需要在R平台下写出你需要查看的函数名，回车即可
		输入（函数名），查看（该函数）代码，如：输入dist，查看dist函数代码

		# 如果函数式类函数(Generic Function),先使用methods()函数查看类函数列表，找到具体需要的函数，然后按照单个函数的情况处理  
		methods(summary)

9)查看前（后）几行数据

		# 查看一个矩阵|向量|数据框|表格|函数的前（后）几行
		# 随机看看对象中的一些内容，还可以使用car包中的some函数
		  head() 
		  tail() 
		  head(CO2,8)  
		  tail(CO2,8)

10)定义数据类型

		inverses <- vector(mode = "list", 100)
		inverses <- vector(mode = "integer", 100)

11)with() 函数的用法

		# 生成4组完整的数据库并赋给imp 
		imp=mice(nhanes2,m=4) 
		# 生成线性回归模型  
		fit=with(imp,lm(chl~age+hyp+bmi)) 
		# 对建立的4个模型进行汇总  
		pooled=pool(fit)   
		# 展示pooled的内容 
		summary(pooled)

12)向量去重

		# 有时可能希望删除向量内重复的元素，这时可以使用unique<向量对象>来实现。例如：
		a <- c(1,2,1,4,2,5,1,1)
		unique(a)
		[1] 1 2 4 5

		# 在本例中，对包含重复元素的向量a进行了去重操作。此功能同样也可以使用table函数来实现，不过比较麻烦。例如：
		as.numeric(names(table(a)))

13)函数的编辑

		# R提供了一个edit函数，让使用者可在一个特定的窗口中更改自设函数，使用者便不用在每次更改函数时重打一次。fix函数会使用窗口中的预设编辑器(记事本)。
		> fix(stdev)

		# 输入上述指令后，便会出现一个记事本的窗口，让使用者更改stdev的定义。当更改完毕后关闭窗口，新的定义便会自动储存。R还有内置函数edit ,可以用来编辑R原始码的档案:
		> edit(file="myfile.r")

		# 忠告:在编写函数及R原始码档案时，读者应尽量使用批注及缩排(indent)。这样可使函数及原始码更容易阅读及修改。绝大部分的程序编写员都会遵从这些习惯。

14)R语言屏幕输出

		cat("the total number is:",3+5,"\n")
		print(x, ...)

15)输入输出

		cat，print：显示对象
		sink：输出转向到指定文件
		dump，save，dput，write：输出对象
		scan，read.table，load，dget：读入

16)网络浏览

		browseURL：浏览某个指定的网页
		download.file：下载网络文件到本地

17)数据框按照某一列排序

		# 例如存放学生信息的数据框 rt(name,sex,age,score)，按照分数 score 递减排序：
		> rt[order(rt[,4],decreasing=T),]   ## 特别注意后面的逗号别忘了！

18)小数取整

		> x <- 3.555555
		> ceiling(x)
		>  4
		> floor(x)
		>  3
		> trunc(x)
		>  3
		> round(x, digits = 0)
		>  4
		> signif(x, digits = 6)
		>  3.55556

19)查看某个元素是否在向量里面，用 %in% ：

		> 34 %in% c(1,2,3,4,34,44)
		[1] TRUE

20)求某个日期的前一天

		> as.Date("2015-07-27") - 1
		[1] "2015-07-26"

21)输出字符串时要换行，print 中 \n 是无效的，要用 cat

		> print("ABC\nDEF")
		> "ABC\nDEF"
		> cat("ABC\nDEF")
		ABC
		DEF

22)数据框行数、列数（标签）操作

		求数据框的行数：nrow(dt)
		求数据框的列数：ncol(dt)
		求数据框的行标签：rownames(dt)
		求数据框的列标签：colnames(dt)

23)把数据框按照某一列的不同值切分成几个数据框，用 split()

		> dt <- data.frame(AA=c(1,2,3), BB=c('a','b','a'))
		> dt
		  AA BB
		1  1  a
		2  2  b
		3  3  a
		> group = split(dt, dt$B)
		> group
		$a
		  AA BB
		1  1  a
		3  3  a
		
		$b
		  AA BB
		2  2  b

24)计算程序运行的时间

		> ptm <- proc.time()
		> a = 1 + 1   ## 此处放你的程序
		> print(proc.time() - ptm)
		用户 系统 流逝 
		0.00 0.00 1.47

25)用cut()函数将一般的数据转换成因子或有序因子

		exam <- c(98, 97, 52, 88, 85, 75, 97, 92, 77, 74, 70, 63, 97, 71, 98, 65, 79, 74, 58, 59, 60, 63, 87, 82, 95, 75, 79, 96, 50, 88)
		#切分成3组
		exam1 <- cut(exam, breaks = 3) 
		#切分成自己设置的组
		exam2 <- cut(exam, breaks = c(0, 59, 69, 79, 89, 100)) 
		attr(exam1, 'levels'); attr(exam2, 'levels'); attr(exam2, 'class')
		#一个有序因子
		ordered(exam2, labels = c('bad', 'ok', 'average', 'good', 'excellent'))

26)NULL是空，NULL是气，NULL在R中就是空气

		# 如果表达式（expression）或者函数（function）的值没有定义，那么将返回NULL。在R中，NULL与很多对象合并在一起时，都被忽略掉。比如以下例子：
		
		# NULL is neglected in vector
		> c(1, NA, NULL, FALSE)
		[1]  1 NA  0
		
		# also in matrix
		> matrix(c(1, NA, NULL, 2), c(2, 2))
		     [,1] [,2]
		[1,]    1    2
		[2,]   NA    1
		
		# 警告信息：
		In matrix(c(1, NA, NULL, 2), c(2, 2)) : 数据长度[3]不是矩阵行数[2]的整倍
		
		# also in list
		> tmp <- list(1, 2)
		> tmp[1] <- NULL
		> tmp
		[[1]]
		[1] 2
		> tmp[[1]] <- NULL
		> tmp
		list()
		
		# 如果一定要将列表中的某个个元素赋值为NULL，可以使用list(NULL)，比如：
		> tmp <- list()
		> tmp[1] <- list(NULL)
		> tmp
		[[1]]
		NULL
		> is.null(tmp[[1]])
		[1] TRUE

27)list不是万能的，但没有list是万万不能的

列表（list）在R中是个全能选手、无所不“包”；list还是金箍棒，别看它丫的开始长度（length()）短，之后想变长就变长，多长都行。

这暗示list可以这样用：在循环开始时，我们不知道会产生多少个元素，可以事先规定输出结果为a <- list()，之后赋值；甚至可以按照名字赋值，比如a$add <- exprs。

创建

如果要创建一个长度为n的、每个元素都为NULL的list，可以使用vector("list", n)。

插入

如果要在list中插入元素，可以使用append(x, values, after = length(x))函数。append()函数原本是对vector设计的，但是list也能使用。

28)创建“空”值很淡定，要么空来要么0

如果要创建一个空的对象（对象的长度是0）很容易，比如：

创建一个长度为0的数值向量

	numeric()或者numeric(0)
	character()或者character(0)
	integer()或者integer(0)可以起到同样的效果
	factor()创建一个长度为0的因子
	注意：factor(0)的长度是1

创建一个长度为0的矩阵

	matrix(0, 0, 0)
	注意：array()创建的对象长度为1。

创建一个长度为0的列表

	list()

创建一个长度为0的data.frame

	data.frame()

29)对象转换要小心，data.frame是陷阱

R中一些对象转换要格外小心，特别是牵扯到data.frame类型。以下是几个常见的陷阱：

5.1 “字符型因子”转换为“数值型向量”

	# 需要先转成字符串向量过渡一下：
	as.numeric(as.character(MyFactor))

5.2 字符和数值因子混搭data.frame

	# 每一列是按照字符型因子保存。留意表面上是数值的一列，它非常危险，特别是排序。一个例子：
	> a1 <- as.factor(as.character(a1))
	> a1
	 [1] 5  6  7  8  9  10 11 12 13 14 15
	Levels: 10 11 12 13 14 15 5 6 7 8 9
	> sort(a1)
	 [1] 10 11 12 13 14 15 5  6  7  8  9
	Levels: 10 11 12 13 14 15 5 6 7 8 9

30)多个else/if别担心，switch()函数来帮助

如果需要在不同情况下，对变量进行不同的处理，自然会联想到使用多个多个else/if。如果else/if是用来处理的简单的赋值，可以使用switch(EXPR, ...)函数。其中，EXPR是一个表达式，生成一个数字或者字符串；接下来，使用生成的数字和字符串匹配...中的内容。

所以，我们很容易想到，如果EXPR生成的数字，则对应匹配...的第几个元素，此时...中的变量可以没有名字；如果是字符串，就会严格地匹配...中相同名字的变量；如果EXPR生成是字符串，...中没有相匹配的变量名，则返回NULL；如果...中有一个“无名”变量（即没有对变量赋值），上一种情况下返回该无名变量，相当于最后一个else。比如：

	> switch(1, a = 3, b = 2)
	[1] 3
	> switch(2, aa = 'red', bb = 'blue', cc = 'yellow', 'No value')
	[1] "blue"
	> switch('aa', aa = 'red', bb = 'blue', cc = 'yellow', 'No value')
	[1] "red"
	> switch('dd', aa = 'red', bb = 'blue', cc = 'yellow', 'No value')
	[1] "No value"
	> switch('bb', aa = 'red', bb = , cc = 'yellow')
	[1] "yellow"
	> switch(2, aa = 'red', bb = , cc = 'yellow')
	Error: empty alternative in numeric switch
	> switch('dd', aa = 'red', bb = , cc = 'yellow', 'no', 'value')
	Error: duplicate switch defaults: '"no"' and '"value"'

注意：

如果EXPR是数字，范围不能超过...的长度。同时，虽然此时...变量可以名字，但是有名字的变量必须有数值，不能学习以上例子中倒数第二种情况，否则会报错。
如果EXPR是字符串，那么会进行自动继承，即前者继承后者。
虽然EXPR是字符串情况可以自动继承，甚至继承一个无名变量，但是无名变量只能有一个。
最后将EXPR明确写出，为了R的版本兼容。

总结： swich()函数是一个好玩却又危险的函数，一个没有歧义的使用方法是：EXPR明确写出，且返回字符串，...中每一个变量都有确切的值，无名变量只有一个，比如：switch(EXPR='dd', aa = 'red', bb = 'blue', cc = 'yellow', 'no value')。

posted @ 2016-05-03 14:31 银河统计阅读(2423) 评论(0) 编辑收藏举报

银河统计

哈尔滨商业大学银河统计工作室

R语言-实用功能性语句1

目录概览