摘要:
1. DataFrame因为存储的是二维表数据结构,可以被针对,所以可以 自动优化执行流程。 2. 自动优化依赖Catalyst优化器 3. 自动优化2个大的优化项是:1. 断言(谓词)下推(行过滤) 2. 列 值裁剪(列过滤) 4. DataFrame代码在被优化有,最终还是被转换成RDD去执行 阅读全文
摘要:
1. DataFrame因为存储的是二维表数据结构,可以被针对,所以可以 自动优化执行流程。 2. 自动优化依赖Catalyst优化器 3. 自动优化2个大的优化项是:1. 断言(谓词)下推(行过滤) 2. 列 值裁剪(列过滤) 4. DataFrame代码在被优化有,最终还是被转换成RDD去执行 阅读全文
|