打赏
摘要: 不多说,直接上干货! 见具体, Hadoop+Spark大数据巨量分析与机器学习整合开发实战的第13章 使用决策树二元分类算法来预测分类StumbleUpon数据集 见具体 Hadoop+Spark大数据巨量分析与机器学习整合开发实战的第14章 使用逻辑回归二元分类算法来预测分类StumbleUpo 阅读全文
posted @ 2017-08-30 22:23 大数据和AI躺过的坑 阅读(234) 评论(0) 推荐(0) 编辑
摘要: 不多说,直接上干货! 首先,要明白为什么有时候,数值特征字段需要进行标准化? 答:因为,当我们若用回归分析算法时,必须将数值特征字段进行标准化,这是因为数值特征字段单位不同,数字差异很大,所以无法彼此比较,这时,就需要使用标准化,使得数值特征字段具有共同的标准。 加入数据标准化 withMean = 阅读全文
posted @ 2017-08-30 21:48 大数据和AI躺过的坑 阅读(940) 评论(0) 推荐(0) 编辑
摘要: 不多说,直接上干货! spark-1.6.1-bin-hadoop2.6里Basic包下的JavaSparkPi.java spark-2.2.0-bin-hadoop2.6里Basic包下的JavaSparkPi.java 阅读全文
posted @ 2017-08-30 21:24 大数据和AI躺过的坑 阅读(632) 评论(0) 推荐(0) 编辑
摘要: 不多说,直接上干货! jdk1.8 源码, Linux的同学可以用的上. 由于源码JDK是前版本的超集, 所以1.4, 1.5, 1.6, 1.7都可以用的上. 其实大家安装的jdk路径下,这里面是已经有的。只是有些人安装下来之后,删除了。 前言:这件事情的重要性不言而喻,对于学习和观摩优秀的代码非 阅读全文
posted @ 2017-08-30 20:04 大数据和AI躺过的坑 阅读(821) 评论(0) 推荐(0) 编辑
摘要: 不多说,直接上干货! spark-1.6.1-bin-hadoop2.6里Basic包下的SparkPi.scala spark-2.2.0-bin-hadoop2.6里Basic包下的SparkPi.scala 阅读全文
posted @ 2017-08-30 18:19 大数据和AI躺过的坑 阅读(1314) 评论(0) 推荐(0) 编辑
摘要: 不多说,直接上干货! 关于下载,这两个spark-2.2.0-bin-hadoop2.6和spark-1.6.1-bin-hadoop2.6发行包不多赘述。 我是解压在D:\SoftWare方便为了导入其中的所需jar包 这里,我是在Scala IDEA for Eclipse里,手动来构建spar 阅读全文
posted @ 2017-08-30 18:12 大数据和AI躺过的坑 阅读(791) 评论(0) 推荐(0) 编辑
摘要: 不多说,直接上干货! 具体,见 Hadoop+Spark大数据巨量分析与机器学习整合开发实战的第13章 使用决策树二元分类算法来预测分类StumbleUpon数据集 阅读全文
posted @ 2017-08-30 09:43 大数据和AI躺过的坑 阅读(464) 评论(0) 推荐(0) 编辑