01 2019 档案

摘要:1、整体流程(这里不是wordcount例子,但整体流程相同) 2、对整体流程有整体了解后,接下来使用Maven创建scala工程,也可以使用sbt,具体区别请参考博文:https://blog.csdn.net/TXBSW/article/details/84070499,如果之前没有配置Mave 阅读全文
posted @ 2019-01-18 17:23 小呆蝎子 阅读(687) 评论(0) 推荐(0) 编辑
摘要:Spark MLlib中分类和回归算法: -分类算法: pyspark.mllib.classification -朴素贝叶斯 NaiveBayes -支持向量机(优化:随机梯度下降)SVMWithSGD -逻辑回归 LogisticRegressionWithSGD // 从Spark 2.0开始 阅读全文
posted @ 2019-01-16 19:26 小呆蝎子 阅读(1022) 评论(0) 推荐(0) 编辑