摘要:
这篇博客 是在Scala IDEA for Eclipse里手动创建scala代码编写环境。 Scala IDE for Eclipse的下载、安装和WordCount的初步使用(本地模式和集群模式) 本博文,教大家,用maven来创建。 第一步:安装scala插件 因为,我win7下的scala环 阅读全文
摘要:
不多说,直接上干货! VectorSlicer 算法介绍: VectorSlicer是一个转换器,输入特征向量,输出原始特征向量子集。VectorSlicer接收带有特定索引的向量列,通过对这些索引的值进行筛选得到新的向量集。 可接受如下两种索引: 1、整数索引,setIndices()。 2、字符 阅读全文
摘要:
不多说,直接上干货! 特征选择里,常见的有:VectorSlicer(向量选择) RFormula(R模型公式) ChiSqSelector(卡方特征选择)。 ChiSqSelector用于使用卡方检验来选择特征(降维)。即来特征选择。 我这里,采取手动创建。(但是,这仅仅是为了初学者。我不建议,最 阅读全文
摘要:
不多说,直接上干货! 特征选择里,常见的有:VectorSlicer(向量选择) RFormula(R模型公式) ChiSqSelector(卡方特征选择)。 RFormula用于将数据中的字段通过R语言的Model Formulae转换成特征值,输出结果为一个特征向量和Double类型的label 阅读全文
摘要:
不多说,直接上干货! 特征选择里,常见的有:VectorSlicer(向量选择) RFormula(R模型公式) ChiSqSelector(卡方特征选择)。 VectorSlicer用于从原来的特征向量中切割一部分,形成新的特征向量,比如,原来的特征向量长度为10,我们希望切割其中的5~10作为新 阅读全文
摘要:
不多说,直接上干货! 主成分分析(Principal Component Analysis,PCA), 将多个变量通过线性变换以选出较少个数重要变量的一种多元统计分析方法。 参考 http://blog.csdn.net/legotime/article/details/51836026 阅读全文
摘要:
不多说,直接上干货! 阅读全文
摘要:
不多说,直接上干货! 阅读全文
摘要:
不多说,直接上干货! 。 阅读全文
摘要:
不多说,直接上干货! 肯定也有不少博友,跟我一样,刚开始接触的时候,会对这三个概念混淆。 以下是,特征处理、特征提取、特征转换和特征选择的区别! 特征处理主要包含三个方面:特征提取、特征转换和特征选择。 见我下面的博客 机器学习概念之特征提取(Feature extraction) 机器学习概念之特 阅读全文