摘要: 1.Spark SQL出现的 原因是什么? SparkSQL是spark用来处理结构化的一个模块,它提供一个抽象的数据集DataFrame,并且是作为分布式SQL查询引擎的应用,可以将执行效率大大提升。 2.用spark.read 创建DataFrame 3.观察从不同类型文件创建DataFrame 阅读全文
posted @ 2021-05-09 21:45 方大师 阅读(73) 评论(0) 推荐(0) 编辑