R的数据结构

1.对象的5种基本类型

  • 字符(character)
  • 数值(numeric:real numbers)
  • 整数(integer)
  • 复数(complex):1+2i
  • 逻辑(logical:TRUE/FALSE)

2.对象的属性(attribute)

  • 名称(name)
  • 维度(dimensions:matrix,array)
  • 类型(class)
  • 长度(length)

3.向量(vector)

  • 只能包含同一类型的对象
  • 创建向量
  1. vector()
  2. c()
  3. as.logical()/as.numeric()/as.character()

4.列表

  • 可以包含不同类型对象
  • 创建列表
  1. list()

4.因子(factor)

  • 分类数据/有序(低中高) vs 无序(男女)
  • 整数向量+标签(label)
  • 常用于lm(),glm()

5.缺失值

  • NA/NaN:NaN属于NA,NA不属于NaN
  • NA有类型属性:integer NA,character NA等
  • is.na()/is.nan()

6.数据框(data frame)

  • 存储表格数据
  • 视为各元素长度相等的列表
  1. 每个元素代表一列数据
  2. 每个元素的长度代表行数
  3. 元素类型可以不同
  • 时间:POSIXct/POSIXlt
  1. 距离1970-01-01的秒数/Sys.time()
  2. POSIXct:整数,常用于存入数据框
  3. POSIXlt:列表,还包含星期、年、月、日等信息

7.日期和时间

  • 日期:Date
  1. 距离1970-01-01的天数/date()/Sys.Date()
  2. weekdays()/months()/quarters()

 8.矩阵在另一篇中有描述,数组和矩阵的区别,数组可以多维,矩阵只能2维。

posted @ 2017-03-30 11:54  派。  阅读(247)  评论(0编辑  收藏  举报