R学习小计

安装R扩展包:install.packages("FKF")
http://www.douban.com/note/243004605/
1、输入数据

l读入有分隔符数据:A<-Scan(file=“./a.txt”,sep=“;”)

l读入首行为文件头的数据:

txt格式: z<-read.table("a1.txt",header=T)

csv格式: z1<-read.csv("ab.csv",header=T)

将数据写入本地:

write.table(iris,file='abc.csv',sep=',')

l生成规则数据:A<-1:10 ;B<-seq(1,5,0.5)

l生成随机数据:A<-rnorm(10,mean=0,sd=1)

计算日期:

> mydate=as.POSIXct(1400906973173/1000, origin = "1970-01-01 00:00:00")

> mydate

[1] "2014-05-24 12:49:33 CST"

> format(mydate, format="%Y-%m-%d %H-%M-%OS3")

[1] "2014-05-24 12-49-33.173"

> as.Date('2014-02-20')+100

 

[1] "2014-05-31"

2、矩阵向量计算

生成向量

v<-c(1,2,3,4,5)

查看向量长度: length(v)

> length(v)

[1] 5

查看向量的数据类型: mode(v)

> mode(v)

[1] "numeric"

注意:NA表示缺失值

生成序列函数:

> a1<-seq(-2,1,0.5)

> a1

 

[1] -2.0 -1.5 -1.0 -0.5 0.0 0.5 1.0

> rep("hi",5)

[1] "hi" "hi" "hi" "hi" "hi"

gl(k,n) k表示因子水平个数;n表示每个水平的重复数

> gl(2,3,labels=c("female","male"))

[1] female female female male male male

Levels: female male

 

l生成矩阵:A<-matrix(1:12,nrow=3,ncol=4)

l矩阵转置:t(A)

l矩阵相乘:A%*%B

l矩阵求逆:solve(A)

3、数据框:与二维矩阵类似,但是每列可以有不同类型的数据。

> my.dataset<-data.frame(site=c('A','B','A','A','B'),

+ season=c('Winter','Summer','Summer','Spring','Fall'),

+ pH=c(7.4,6.3,8.6,7.2,8.9))

> my.dataset

site season pH

1 A Winter 7.4

2 B Summer 6.3

3 A Summer 8.6

4 A Spring 7.2

5 B Fall 8.9

> my.dataset$pH

 

[1] 7.4 6.3 8.6 7.2 8.9

> my.dataset[my.dataset$pH>6,]
site season pH
1 A Winter 7.4
2 B Summer 6.3
3 A Summer 8.6
4 A Spring 7.2
5 B Fall 8.9
4、画图(专门显示图形的窗口)

l列出已开启的绘图设备:dev.list()

l给出正在使用的绘图设备: dev.cur()

l画图函数:plot(),pie(),hist(),barplot()等

5、功能性语句

l查看保存在内存中的变量:Ls()

l删除指定变量:rm(A)

l查看帮助:?rm

6、汇总数据

l显示变量频数 table(x)

l 输出频数直方图: barplot(table(x))

l 输出频数饼图: pie(table(x))

l 汇总后画图:barplot(table(x1,x2),beside=T,col=1:4)

l 统计量图形表示:

barplot(apply(z1[,2:3],1,mean))

pie(apply(z1[,2:3],2,mean))

boxplot(z1[,2:3])

处理数据:

sapply(UScrime[c("U1", "U2")], function(x) (c(mean = mean(x), sd = sd(x))))

sapply(UScrime[c("U1", "U2")], median)

变量的重组:

class <- state.region

> var <- state.x77[, c("Illiteracy")]

 

> mydata <- as.data.frame(cbind(class, var))

7、连接mysql数据库

 

1、 配置MySQL ODBC必须先安装MySQL ODBC driver 下载地址可以为:http://www.mysql.com/downloads/connector/odbc/

2、控制面板\系统和安全\管理工具 选择 “数据源(ODBC)”

enter image description here

3、完成配置后,进入R,就能用了


> library(RODBC)
> test = odbcConnect('mysqldata')
> sqlQuery(test,"select * from test.user")
转载至:http://www.ituring.com.cn/article/34860

程序实践:

导入数据:a<-read.csv("abc.csv",header=T)

sam=0

for(i in 1:115518)

{ sam=sam+a[i,1]

b[i]=a[i,2]/sam

}

 

导出到文档文件夹:write.csv(b, file="b.csv", row.names=FALSE)

 


R语言处理字符串:

http://blog.sina.com.cn/s/blog_49040b720100rlkj.html

R在Centos下安装

R语言是主要用于统计分析、绘图的语言和操作环境。
官方网站:
http://www.r-project.org/
Windows下面有直接的安装包,直接下载安装很方便,但是对于刚出的CentOS6.0上不能直接通过yum 安装R,需要自己编译。
下载页面:
http://ftp.ctex.org/mirrors/CRAN/
在编译R之前,需要通过yum安装以下几个程序:
#yum install gcc-gfortran #否则报”configure: error: No F77 compiler found”错误
#yum install gcc gcc-c++ #否则报”configure: error: C++ preprocessor “/lib/cpp” fails sanity check”错误
#yum install readline-devel #否则报”–with-readline=yes (default) and headers/libs are not available”错误
#yum install libXt-devel #否则报”configure: error: –with-x=yes (default) and X11 headers/libs are not available”错误
然后下载源代码,编译
#cd
#wget http://ftp.ctex.org/mirrors/CRAN/src/base/R-2/R-2.13.1.tar.gz
#tar zxvf R-2.13.1.tar.gz
#cd R-2.13.1
#./configure
#make
#make install
即可完成编译安装。
转载:http://blog.sina.com.cn/s/blog_6cfc336b01018wvl.html

posted on 2016-01-29 14:33  数据民工张三省  阅读(277)  评论(0编辑  收藏  举报

导航