r语言

R语言

R语言是动态语言

环境搭建

先安装R再安装Rstudio,注意要保证:

  • R语言安装指定为64位;
  • R语言和Rstudio的安装路径不要有汉字;
  • R语言和Rstudio的安装父目录要为同一个。

R对象和函数

  • R对象可以看作是具有关联名称的存储空间。R中的一切都存储在对象中。所有的变量、数据、函数都以命名对象的形式存储在计算机的内存中。

对象赋值运算符:<-

>x <-945
>x
[1] 945


就是把945赋值给x,数值前的“[1]”可以读作“此行是从对象的第一个元素开始显示的值”。

  • R语言赋值操作支持数值表达式,此种情况下,对象存储表达式的计算结果:
> z <- 5
> w <-z^2

>w

[1] 25
  • 值得注意的是:创建的每个对象都存储在计算机内存中,直到删除它。可通过命令ls()或objects()列举出当前内存中的对象。
  • R中最基本的对象,有模式和长度两种属性。模式指的是存储类型,长度是包含的元素数量。
  • R的基本数据类型有:字符型character、逻辑型logical、数值型numeric、复数型complex。注意:R的字符型事实上是一组字符,而非单个字符,类似其它语言的字符串类型。逻辑值只能是T(TRUE)和F(FALSE),True或False等不是有效的逻辑值,因为R中的名称是大小写敏感的。
  • 在R中显式的运行循环( for in,while等)效率是很低的,所以尽可能通过其他方式来避免显式循环,可选的方式有:

逻辑索引向量替代,如y[x%%2==0] <- 0

R连接mysql

options(download.file.method="libcurl")

install.packages("RMySQL")

library(RMySQL)

con <- dbConnect(MySQL(),
                 
                 host='localhost',
                 
                 user='root',
                 
                 password='root‘,
                 
                 dbname='test')
adminrole<- dbGetQuery(con, "select * from adminrole")

print (adminrole)


dbDisconnect(con)

R连接Oracle

方法一:

library(RODBC)

方法二:

较为复杂,和java的jdbc连接数据库操作类似

R连接 Sql sever

  • 创建数据源RODBC
  • .连接
library(RODBC);
dbhandle <- odbcDriverConnect('driver={SQL Server};server=(local);database=TESTdatabase;trusted_connection=true');#TESTdatabase为数据库
res <- sqlQuery(dbhandle, 'select * from  class ');#class为TESTdatabase数据库中表
sqlSave(dbhandle,res,"A",append=FALSE);
odbcClose(dbhandle);

R连接 db2

library(RJDBC)

R操作excel(依赖java环境)

1.首先安装xlsx包,并进行加载包

install.packages("xlsx")
library("xlsx")
  1. 实现数据的输出
input.xlsx.data <- read.xlsx("input.xlsx", sheetIndex = 1)
print (input.xlsx.data)

这样既可得到excel表里的数据

R操作csv

data2 = read.table("writetest.csv",header=F, sep=",")
print (data2)

R语言数据类型

矢量
列表
矩阵
数组
因子
数据帧

  • 这些对象中最简单的是向量对象,并且这些原子向量有六种数据类型,也称为六类向量。 其他R对象建立在原子向量之上。 Logical(逻辑型),Numeric(数字),Integer(整型),Complex(复合型),Character(字符),Raw(原型)

使用

1. Vectors 向量

当你想用多个元素创建向量时,你应该使用c()函数,这意味着将元素组合成一个向量。

apple <- c('red','green',"yellow")
print(apple)

2.Lists 列表

列表是一个R对象,它可以在其中包含许多不同类型的元素,如向量,函数甚至其中的另一个列表。

list1 <- list(c(2,5,3),21.3,sin)

3. Matrices 矩阵

M = matrix( c('a','a','b','c','b','a'), nrow = 2, ncol = 3, byrow = TRUE)
print(M)

4.Arrays 数组

虽然矩阵被限制为二维,但阵列可以具有任何数量的维度。 数组函数使用一个dim属性创建所需的维数。 在下面的例子中,我们创建了一个包含两个元素的数组,每个元素为3x3个矩阵。

a <- array(c('green','yellow'),dim = c(3,3,2))
print(a)

输出:

, , 1

     [,1]     [,2]     [,3]    
[1,] "green"  "yellow" "green" 
[2,] "yellow" "green"  "yellow"
[3,] "green"  "yellow" "green" 

, , 2

     [,1]     [,2]     [,3]    
[1,] "yellow" "green"  "yellow"
[2,] "green"  "yellow" "green" 
[3,] "yellow" "green"  "yellow"

dim中的2代表维数

5.Factors 因子

因子是使用向量创建的r对象。 它将向量与向量中元素的不同值一起存储为标签。 标签总是字符,不管它在输入向量中是数字还是字符或布尔等。 它们在统计建模中非常有用。
使用factor()函数创建因子。nlevels函数给出级别计数。

6.Data Frames 数据帧

数据帧是表格数据对象。 与数据帧中的矩阵不同,每列可以包含不同的数据模式。 第一列可以是数字,而第二列可以是字符,第三列可以是逻辑的。 它是等长度的向量的列表。
使用data.frame()函数创建数据帧。

posted @ 2018-11-15 22:22  moonok  阅读(404)  评论(0编辑  收藏  举报