摘要: VectorAssembler字段转换成特征向量 VectorIndexer自动识别分类的特征,并对它们进行索引 VectorSlicer向量切割 Bucketizer将连续数据离散化到指定的范围区间 阅读全文
posted @ 2016-12-02 13:54 智能先行者 阅读(2439) 评论(0) 推荐(0) 编辑
摘要: data数据源,请参考我的博客http://www.cnblogs.com/wwxbi/p/6063613.html import org.apache.Spark.sql.DataFrameStatFunctions import org.apache.spark.sql.functions._ 阅读全文
posted @ 2016-12-02 13:11 智能先行者 阅读(2097) 评论(0) 推荐(0) 编辑