摘要: 对于某些工作负载,可以通过在内存中缓存数据或打开一些实验选项来提高性能。 1.在内存中缓存数据 Spark SQL可以通过调用spark.catalog.cacheTable("tableName")或dataFrame.cache()使用内存中的列式格式来缓... 阅读全文
posted @ 2018-11-02 17:59 大数据技术与数仓 阅读(319) 评论(0) 推荐(0) 编辑