大数据和AI躺过的坑

2017年9月2日

使用Zeppelin时出现at org.apache.zeppelin.interpreter.thrift.RemoteInterpreterService$Client.recv_getFormType(RemoteInterpreterService.java:288)错误的解决办法（图文详解）

摘要：不多说，直接上干货！问题详解解决办法是阅读全文

posted @ 2017-09-02 16:08 大数据和AI躺过的坑阅读(911) 评论(0) 推荐(0) 编辑

使用Zeppelin时出现sh interpreter not found错误的解决办法（图文详解）

摘要：不多说，直接上干货！问题详解相关博客是 Zeppelin的入门使用系列之使用Zeppelin运行shell命令（二）解决办法是阅读全文

posted @ 2017-09-02 16:06 大数据和AI躺过的坑阅读(1326) 评论(0) 推荐(0) 编辑

Zeppelin的入门使用系列之使用Zeppelin来运行Spark SQL（四）

摘要：不多说，直接上干货！前期博客 Zeppelin的入门使用系列之使用Zeppelin来创建临时表UserTable（三） 1、　运行年龄统计的Spark SQL (1) 输入Spark SQL时，必须在第一行输入%sql 。 %sql主要是告诉Zeppelin的解释器（Interpreter），后续阅读全文

posted @ 2017-09-02 15:37 大数据和AI躺过的坑阅读(7149) 评论(0) 推荐(0) 编辑

Zeppelin的入门使用系列之使用Zeppelin来创建临时表UserTable（三）

摘要：不多说，直接上干货！前期博客 Zeppelin的入门使用系列之使用Zeppelin运行shell命令（二）我们必须要先使用Spark 语句创建临时表UserTable，后续才能使用Spark SQL进行数据分析以及数据可视化。 1、加载用户数据文件到userText 2、创建UserTable类阅读全文

posted @ 2017-09-02 15:22 大数据和AI躺过的坑阅读(2393) 评论(0) 推荐(0) 编辑

Zeppelin的入门使用系列之使用Zeppelin运行shell命令（二）

摘要：不多说，直接上干货！前期博客 Zeppelin的入门使用系列之创建新的Notebook（一）接下来，我将以ml-100k数据集，示范如何使用Spark SQL进行数据分析与数据可视化因为得到列出ml-100k文件列表然后，在ml-100k Notebook新的段落中输入命令，如下 Zep 阅读全文

posted @ 2017-09-02 10:42 大数据和AI躺过的坑阅读(4043) 评论(0) 推荐(0) 编辑

2017年9月1日

java.lang.UnsupportedOperationException: setXIncludeAware is not supported on this JAXP implementation or earlier: class gnu.xml.dom.JAXPFactory的解决办法（图文详解）

摘要：不多说，直接上干货！问题详情问题分析是jdk的版本、scala版本的子小版本导致的。是以下的是以下的解决办法用我下面的这两个阅读全文

posted @ 2017-09-01 22:53 大数据和AI躺过的坑阅读(3775) 评论(0) 推荐(0) 编辑

Exception in thread "main" java.lang.UnsupportedClassVersionError: com/google/common/base/Function : Unsupported major.minor version 52.0的解决办法（图文详解）

摘要：不多说，直接上干货！问题详情 52.0是jdk1.8 51.0是jdk1.7 问题分析是jdk的版本、scala版本的子小版本导致的。是以下的是以下的解决办法用我下面的这两个阅读全文

posted @ 2017-09-01 22:49 大数据和AI躺过的坑阅读(4170) 评论(0) 推荐(0) 编辑

Spark Mllib里决策树回归分析使用.rootMeanSquaredError方法计算出以RMSE来评估模型的准确率（图文详解）

摘要：不多说，直接上干货！ Spark Mllib里决策树二元分类使用.areaUnderROC方法计算出以AUC来评估模型的准确率和决策树多元分类使用.precision方法以precision来评估模型的准确率（图文详解） Spark Mllib里决策树回归分析使用.rootMeanSquaredEr 阅读全文

posted @ 2017-09-01 16:48 大数据和AI躺过的坑阅读(530) 评论(0) 推荐(0) 编辑

Spark Mllib里决策树回归分析如何对numClasses无控制和将部分参数设置为variance（图文详解）

摘要：不多说，直接上干货！在决策树二元或决策树多元分类参数设置中：使用DecisionTree.trainClassifier 见 Spark Mllib里如何对决策树二元分类和决策树多元分类的分类数目numClasses控制（图文详解）在决策树回归分析参数设置中：使用DecisionTree.t 阅读全文

posted @ 2017-09-01 16:30 大数据和AI躺过的坑阅读(262) 评论(0) 推荐(0) 编辑

Spark Mllib里如何将如温度、湿度和风速等数值特征字段用除以***进行标准化（图文详解）

摘要：不多说，直接上干货！具体，见 Hadoop+Spark大数据巨量分析与机器学习整合开发实战的第18章决策树回归分类Bike Sharing数据集阅读全文

posted @ 2017-09-01 15:53 大数据和AI躺过的坑阅读(334) 评论(0) 推荐(0) 编辑

大数据和人工智能躺过的坑

公告