打赏
上一页 1 ··· 32 33 34 35 36 37 38 39 40 ··· 180 下一页
摘要: 不多说,直接上干货! 问题详解 解决办法 是 阅读全文
posted @ 2017-09-02 16:08 大数据和AI躺过的坑 阅读(911) 评论(0) 推荐(0) 编辑
摘要: 不多说,直接上干货! 问题详解 相关博客是 Zeppelin的入门使用系列之使用Zeppelin运行shell命令(二) 解决办法 是 阅读全文
posted @ 2017-09-02 16:06 大数据和AI躺过的坑 阅读(1326) 评论(0) 推荐(0) 编辑
摘要: 不多说,直接上干货! 前期博客 Zeppelin的入门使用系列之使用Zeppelin来创建临时表UserTable(三) 1、 运行年龄统计的Spark SQL (1) 输入Spark SQL时,必须在第一行输入%sql 。 %sql主要是告诉Zeppelin的解释器(Interpreter),后续 阅读全文
posted @ 2017-09-02 15:37 大数据和AI躺过的坑 阅读(7149) 评论(0) 推荐(0) 编辑
摘要: 不多说,直接上干货! 前期博客 Zeppelin的入门使用系列之使用Zeppelin运行shell命令(二) 我们必须要先使用Spark 语句创建临时表UserTable,后续才能使用Spark SQL进行数据分析以及数据可视化。 1、加载用户数据文件到userText 2、创建UserTable类 阅读全文
posted @ 2017-09-02 15:22 大数据和AI躺过的坑 阅读(2393) 评论(0) 推荐(0) 编辑
摘要: 不多说,直接上干货! 前期博客 Zeppelin的入门使用系列之创建新的Notebook(一) 接下来,我将以ml-100k数据集,示范如何使用Spark SQL进行数据分析与数据可视化 因为 得到 列出ml-100k文件列表 然后,在ml-100k Notebook新的段落中输入命令,如下 Zep 阅读全文
posted @ 2017-09-02 10:42 大数据和AI躺过的坑 阅读(4043) 评论(0) 推荐(0) 编辑
摘要: 不多说,直接上干货! 问题详情 问题分析 是jdk的版本、scala版本的子小版本导致的。 是以下的 是以下的 解决办法 用我下面的这两个 阅读全文
posted @ 2017-09-01 22:53 大数据和AI躺过的坑 阅读(3775) 评论(0) 推荐(0) 编辑
摘要: 不多说,直接上干货! 问题详情 52.0是jdk1.8 51.0是jdk1.7 问题分析 是jdk的版本、scala版本的子小版本导致的。 是以下的 是以下的 解决办法 用我下面的这两个 阅读全文
posted @ 2017-09-01 22:49 大数据和AI躺过的坑 阅读(4170) 评论(0) 推荐(0) 编辑
摘要: 不多说,直接上干货! Spark Mllib里决策树二元分类使用.areaUnderROC方法计算出以AUC来评估模型的准确率和决策树多元分类使用.precision方法以precision来评估模型的准确率(图文详解) Spark Mllib里决策树回归分析使用.rootMeanSquaredEr 阅读全文
posted @ 2017-09-01 16:48 大数据和AI躺过的坑 阅读(530) 评论(0) 推荐(0) 编辑
摘要: 不多说,直接上干货! 在决策树二元或决策树多元分类参数设置中: 使用DecisionTree.trainClassifier 见 Spark Mllib里如何对决策树二元分类和决策树多元分类的分类数目numClasses控制(图文详解) 在决策树回归分析参数设置中: 使用DecisionTree.t 阅读全文
posted @ 2017-09-01 16:30 大数据和AI躺过的坑 阅读(262) 评论(0) 推荐(0) 编辑
摘要: 不多说,直接上干货! 具体,见 Hadoop+Spark大数据巨量分析与机器学习整合开发实战的第18章 决策树回归分类Bike Sharing数据集 阅读全文
posted @ 2017-09-01 15:53 大数据和AI躺过的坑 阅读(334) 评论(0) 推荐(0) 编辑
上一页 1 ··· 32 33 34 35 36 37 38 39 40 ··· 180 下一页