第1章--R语言介绍

1.1 R的使用

R是一种区分大小写的语言，R中有多种数据类型，包括向量、矩阵、数据框（与数据集类似）以及列表（各种对象的集合）。

R使用<-，而不是传统的=作为赋值符号。也可以使用->进行反方向赋值。

> x <- rnorm(5)
> x
[1]  0.009310966  0.225263450
[3]  0.676661303  1.407043899
[5] -0.016697707

注释由#开头，在#后出现的热河文本都会被R解释器忽略。

>#一个R代码示例
> age <- c(1,3,5,2,11,9,3,9,12,3)
> weight <- c(4.4,5.3,7.2,5.2,8.5,7.3,6.0,10.4,10.2,6.1)
> mean(weight)
[1] 7.06
> sd(weight)
[1] 2.077498
> cor(age,weight)
[1] 0.9075655
> plot(age,weight)

想要大致了解R能做出何种图形，可以在命令行中输入：

> demo(graphics)

1.2 获取帮助

R提供了大量的帮助功能，学会如何使用这些帮助文档可以在相当程度上助力你的编程工作。

1.3 工作空间

工作空间(workspace)就是当前R的工作环境，它储存着所有用户定义的对象。在一个R会话结束时，你可以将当前工作空间保存到一个镜像中，并在下一次启动R的时候自动载入它。

1.4 输入和输出

函数source("filename")可在当前会话中执行一个脚本；filename按照管理，以.R为拓展名，但是并不是必须的。

函数sink("filename")将输出重定向到文件filename中，默认情况下，如果文件已存在，则它的内容将被覆盖。

使用参数append=TRUE可以将文本追加到文件后，而不是覆盖它。
参数split=TRUE可将输出同时发送到屏幕和输出文件中。

图形输出：要重定向图形输出，使用下表中的函数即可，最后使用dev.off()将输出返回到终端。

1.5 包

使用命令install.package()用来第一次安装一个包，不加参数执行将显示一个CRAN的镜像站点的列表。

如果知道自己想安装的包的名称，可以直接将包名作为参数提供给这个函数例如install.package("gclus")。

一个包仅需安装一次，需要更新的时候使用命令update.package()。

当需要调用这个包的时候，使用library("gclus")，如果需要，你可以自定义启动环境以自动载入会频繁使用的那些包。

1.6 批处理

多数情况下，我们都会交互地使用R：在提示符后输入命令，接着等待该命令的输出结果。偶尔，我们可能想要以一种重复的，标准化的，无人值守的方式执行某个R程序。例如，你可能需要每一个月生成一次相同的报告，这时就可以在R中编写程序，在批处理模式下执行它。

在Linux或OS X系统下，可以在终端窗口中使用命令：

R CMD BATCH options infile outfile

其中infile是包含了要执行的R代码所在的文件的文件名；

outfile是接受输出文件的文件名；

options部分则列出了控制执行细节的选项。

对于windows，则使用：

"C:\Program Files\R\R-3.3.3\bin\R.exe" CMD BATCH
  --vanilla --slave "C:\my projects\myscript.R"

1.7 将输出用为输入——结果的重用

R的一个非常实用的特点是，分析的输出结果可以轻松保存，并作为进一步分析的输入使用。

1.8 处理大数据集

posted @ 2016-10-09 10:50 cyoutetsu 阅读(427) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

cyoutetsu