08 2018 档案

Mastering-Spark-SQL学习笔记02 SparkSession - Spark SQL的入口点

摘要：SparkSession是在使用类型化数据集(或基于非类型化Row-基于DataFrame)数据抽象开发Spark SQL应用程序时创建的首批对象之一。在Spark 2.0中，SparkSession将SQLContext和HiveContext合并到一个对象中。使用SparkSession.b 阅读全文

posted @ 2018-08-15 18:55 子秦阅读(796) 评论(0) 推荐(0)

Mastering-Spark-SQL学习笔记01 SparkSQL

摘要：SparkSQL可以让开发人员使用关系化查询对大规模结构化数据进行处理。像Apache Spark一样，Spark SQL特别适合大规模的分布式内存计算。SparkSQL将关系型处理与Spark的函数式编程API进行整合。 SparkSQL和SparkCore的计算模型的主要区别是注入、查询和持久阅读全文

posted @ 2018-08-07 16:36 子秦阅读(382) 评论(0) 推荐(0)

08 2018 档案

公告