11个常见的分类特征的编码技术

机器学习算法只接受数值输入,所以如果我们遇到分类特征的时候都会对分类特征进行编码,本文总结了常见的11个分类变量编码方法。

1、ONE HOT ENCODING

最流行且常用的编码方法是One Hot Enoding。一个具有n个观测值和d个不同值的单一变量被转换成具有n个观测值的d个二元变量,每个二元变量使用一位(0,1)进行标识。

完整文章:

https://avoid.overfit.cn/post/2ebd057b56cd4b54a666de6dd4ed6294

posted @ 2022-11-05 09:23  deephub  阅读(11)  评论(0编辑  收藏  举报