采用SparkSession对象

在Spark 2.x当中，实际上SQLContext和HiveContext是过时的，相反是采用SparkSession对象的sql函数来操作SQL语句的。使用这个函数执行SQL语句前需要先调用DataFrame的createOrReplaceTempView注册一个临时表，所以关键是先要将RDD转换成DataFrame。实际上，在Spark中实际声明了

type DataFrame = Dataset[Row]

所以，DataFrame是Dataset[Row]的别名。RDD是提供面向低层次的API，而DataFrame/Dataset提供面向高层次的API（适合于SQL等面向结构化数据的场合）。

下面提供一些Spark SQL程序的例子。

例子一：SparkSQLExam.scala

posted on 2019-11-26 00:39 大数据bb 阅读(179) 评论(0) 编辑收藏举报

刷新页面返回顶部

大数据bb

导航

公告

采用SparkSession对象