摘要: 1. 官方文档 http://spark.apache.org/docs/latest/running-on-yarn.html 2. 配置安装 2.1.安装hadoop:需要安装HDFS模块和YARN模块,HDFS必须安装,spark运行时要把jar包存放到HDFS上。 2.2.安装Spark:解 阅读全文
posted @ 2019-08-16 19:58 Transkai 阅读(4480) 评论(0) 推荐(0) 编辑
摘要: 一、 以编程方式执行Spark SQL查询 1. 编写Spark SQL程序实现RDD转换成DataFrame 前面我们学习了如何在Spark Shell中使用SQL完成查询,现在我们通过IDEA编写Spark SQL查询程序。 Spark官网提供了两种方法来实现从RDD转换得到DataFrame, 阅读全文
posted @ 2019-08-16 16:20 Transkai 阅读(1012) 评论(0) 推荐(0) 编辑