因子及函数

R语言中的因子着实让我头疼了一段时间,什么是因子,没有一本书上给说的清楚,有的说 类别变量 和 有序类别变量 在R中称为因子(Factor),有的说因子的设计思想来源于统计学的名义变量,也有的说是分类变量,那倒是因子是如何定义的呢,我是没有找到。

经过翻阅图书,查看例子,大概弄清楚了什么是因子, 因子实际也是向量的一种,但它有一个附加的信息 称之为  水平 也就是 向量中 元素去除重复后的 唯一元素。  

简单来说就是那个可以拿来 进行分组的,类似于 SQL语句中   能够进行 group by 的字段。

 

因子的构造是用 Factor()。

 

常用函数:

tapply (x,f,g) 参数 介绍:x 只能是向量,f 因子,g 函数 可以求均值,求和 等函数。

split(x,f)参数介绍:x可以是向量可以使数据框,区别于tapply函数, f 为因子,作用:将x按照f 生成 不同的列表。

by(x,f,g) 作用等同于 tapply, 区别 是   x  可以是向量,矩阵,数据框。

 

posted @ 2017-11-07 10:10  *雪狐*  阅读(340)  评论(0编辑  收藏  举报