06 2018 档案

spark2.3.0 配置spark sql 操作hive

摘要：spark可以通过读取hive的元数据来兼容hive，读取hive的表数据，然后在spark引擎中进行sql统计分析，从而，通过spark sql与hive结合实现数据分析将成为一种最佳实践。配置步骤如下： 1、启动hive的元数据服务 [root@master apache-hive-1.2.2- 阅读全文

posted @ 2018-06-27 10:15 王晓成阅读(8266) 评论(0) 推荐(0) 编辑

spark dataFrame withColumn

摘要：说明：withColumn用于在原有DF新增一列 1. 初始化sqlContext val sqlContext = new org.apache.spark.sql.SQLContext(sc) 2.导入sqlContext隐式转换 import sqlContext.implicits._ 3. 阅读全文

posted @ 2018-06-25 19:17 王晓成阅读(3052) 评论(0) 推荐(0) 编辑

公告

06 2018 档案