摘要: 二元转换BinarizerBinarizer是将连续型变量根据某个阈值,转换成二元的分类变量。小于该阈值的转换为0,大于该阈值的转换为1。 要求输入列必须是double,int都会报错。如下:输入的是0.1,0.8,0.2连续型变量,要以0.5为阈值来转换成二元变量(0,1)。 打印结果: 多了一个 阅读全文
posted @ 2019-04-28 20:12 大葱拌豆腐 阅读(797) 评论(0) 推荐(0) 编辑
摘要: 转载自:https://blog.csdn.net/sunbow0/article/details/50848719 1、基于Spark自动扩展scikit-learn(spark-sklearn)1.1 导论Spark MLlib 将传统的单机机器学习算法改造成分布式机器学习算法,比如在梯度下降算 阅读全文
posted @ 2019-04-28 15:43 大葱拌豆腐 阅读(1384) 评论(0) 推荐(0) 编辑