one-hot encoding与哑变量的区别

one-hot比哑变量的特征位多一位，即哑变量是精简版的one-hot，即在线性回归中用截距项来表示最后一维，但由于最初很难分辨特征的主次关系，且机器学习中多数情况为非线性回归，所以哑变量不太适用（蒙的，有待考证，回头纠正）

one_hot将特征映射到欧式空间，编码后每一个特征都是连续的，可以跟连续特征归一化一样联系起来

树模型不需要one_hot编码，决策树、随机森林，bagging,boost等都不需要