摘要: SparkSQL是Spark的一个子模块,主要用于操作结构化数据,借鉴了Hive。 此前使用的是SparkCore模块的RDD结构进行数据处理,SparkSQL提供了结构化的数据结构DataFrame、DataSet。 SparkSQL支持SQL、DSL(domain-specific langua 阅读全文
posted @ 2020-12-22 13:33 cgl_dong 阅读(203) 评论(0) 推荐(0) 编辑