R语言基础 - 数据结构

1. 对象的五种基本类型(classes of objects)

  - 字符(character)

  - 数值(numeric:real numbers)

  - 整数(integer)

  - 复数(complex):1+2i

  - 逻辑(logical:True / False)

   

2. 属性(attribute)

  - 名称(name)

  - 维度(dimensoins:matrix,array)

  - 类型(class)

  - 长度(length)

3. 数据结构

  - 向量(vector):只能包含同一类型的对象

    1. vector()

    2. c()

    3. as.logical() / as.numeric() / as.character()

    

  - 矩阵(matrix):向量+维度属性(整数向量:nrow,ncol)

    1. matrix() :先列后行

    2. vector() + dim()

    3. cbind(),rbind()

    4. attributes()

    

  - 数组(array):与矩阵相似,但是维度可以大于2

    

  - 列表(list):可以包含不同类型的对象

    

  - 因子(factor):

    1. 分类数据 / 有序 vs. 无序

    2. 整数向量+标签(label)(优于整数向量)

      - Male / Female vs. 1 / 2

      - 常用于 lm(),glm()

    3. 创建因子

      - factor()

      - table() / unclass()

    

  - 缺失值(missing value)

    1. NA / NaN:NaN属于NA,NA不属于NaN

    2. NA有类型属性:interger NA,character NA等

    3. is.na() / is.nan()

    

  - 数据框(data frame)

    1. 存储表格数据(tabular data)

    2. 视为各元素长度相同的列表

      - 每个元素代表一列数据

      - 每个元素的长度代表行数

      - 元素类型可以不同

    

  - 日期 与 时间(date,time)

    1. 日期:Date

      - 距离1970-01-01的天数 / date() / Sys.Date()

      - weekdays() / months() / quarters()

    

    2. 时间:POSIXct / POSIXIt

      - 距离1970-01-01的秒数 / Sys.time()

      - POSIXct:整数,常用于存入数据框

      - POSIXlt:列表,还包含星期、年、月、日等信息

     

    3. 字符 => 日期 / 时间

      - as.Date()

      - as.POSIXct()  /  as.POSIXlt()  /  strptime()

4. 小结

  

 

posted on 2017-02-18 20:53  你的踏板车要滑向哪里  阅读(261)  评论(0编辑  收藏  举报

导航