R的数据结构
1.对象的5种基本类型
- 字符(character)
- 数值(numeric:real numbers)
- 整数(integer)
- 复数(complex):1+2i
- 逻辑(logical:TRUE/FALSE)
2.对象的属性(attribute)
- 名称(name)
- 维度(dimensions:matrix,array)
- 类型(class)
- 长度(length)
3.向量(vector)
- 只能包含同一类型的对象
- 创建向量
- vector()
- c()
- as.logical()/as.numeric()/as.character()
4.列表
- 可以包含不同类型对象
- 创建列表
- list()
4.因子(factor)
- 分类数据/有序(低中高) vs 无序(男女)
- 整数向量+标签(label)
- 常用于lm(),glm()
5.缺失值
- NA/NaN:NaN属于NA,NA不属于NaN
- NA有类型属性:integer NA,character NA等
- is.na()/is.nan()
6.数据框(data frame)
- 存储表格数据
- 视为各元素长度相等的列表
- 每个元素代表一列数据
- 每个元素的长度代表行数
- 元素类型可以不同
- 时间:POSIXct/POSIXlt
- 距离1970-01-01的秒数/Sys.time()
- POSIXct:整数,常用于存入数据框
- POSIXlt:列表,还包含星期、年、月、日等信息
7.日期和时间
- 日期:Date
- 距离1970-01-01的天数/date()/Sys.Date()
- weekdays()/months()/quarters()
8.矩阵在另一篇中有描述,数组和矩阵的区别,数组可以多维,矩阵只能2维。