信息增益,信息增益率
摘要:https://blog.csdn.net/u013164528/article/details/44359677
阅读全文
PCA 降维
摘要:http://f.dataguru.cn/spark-751832-1-1.html 我们可以利用PCA算法将向量的维数降低,从而实现特征转化。具体原理在《机器学习》课程中有详细的讲述。故此处将直接介绍如何利用MLlib中的PCA算法进行特征转换。下列演示了如何计算主成分向量并实现向量降维,同时保持
阅读全文
gain 基尼系数
摘要:转至:http://blog.csdn.net/bitcarmanlee/article/details/51488204 在信息论与概率统计学中,熵(entropy)是一个很重要的概念。在机器学习与特征工程中,熵的概念也用得灰常多。今天就把跟熵有关的东东稍微整理一下,权当笔记。 1.信息熵 熵是神
阅读全文
特征工程、特征处理,数据清洗
摘要:http://www.cnblogs.com/fionacai/p/6159184.html
阅读全文
特征工程
摘要:转至博文:http://www.cnblogs.com/jasonfreak/p/5448385.html 知乎问答:https://www.zhihu.com/question/29316149 归一化,正则化:http://blog.csdn.net/u012102306/article/det
阅读全文