摘要: 2.SparkSQL 编程 2.1 SparkSession 新的起始点 在老的版本中,SparkSQL 提供两种 SQL 查询起始点:一个叫 SQLContext,用于 Spark 自己 提供的 SQL 查询;一个叫 HiveContext,用于连接 Hive 的查询。 SparkSession 阅读全文
posted @ 2019-07-08 04:58 LXL_1 阅读(297) 评论(0) 推荐(0) 编辑
摘要: 1.Spark SQL 概述 1.1 什么是 Spark SQL Spark SQL 是 Spark 用来处理结构化数据的一个模块,它提供了 2 个编程抽象:DataFrame 和 DataSet,并且作为分布式 SQL 查询引擎的作用。 我们已经学习了 Hive,它是将 Hive SQL 转换成 阅读全文
posted @ 2019-07-08 03:13 LXL_1 阅读(401) 评论(0) 推荐(0) 编辑