类别特征处理

1. 序号编码

如成绩可以分为高,中,低,序号编码保留了大小关系

2. 独热编码

(1)可以使用稀疏向量存储来节省空间。

(2)可以配合特征选择等方法降维

3. 二进制编码

二进制编码相对于独热编码来说更节省空间。

 

posted @ 2019-07-11 11:14  xd_xumaomao  阅读(180)  评论(0编辑  收藏  举报