spark 3.0新特性

一、Adaptive Query Execution 自适应查询

https://blog.51cto.com/u_12865/7338853

 

 

二、Dynamic Partion Pruning 动态裁剪分区

Apache Spark 3.0 动态分区裁剪(Dynamic Partition Pruning)介绍

https://www.iteblog.com/archives/8589.html

SELECT * FROM dim_iteblog

JOIN fact_iteblog
ON (dim_iteblog.partcol = fact_iteblog.partcol)
WHERE dim_iteblog.othercol > 10

在join时候,谓词下推的基础上,在根据关联键对另一张表进行分区剪裁,大大减少jion的数据量

 

Apache Spark 3.0 动态分区裁剪(Dynamic Partition Pruning)使用

https://www.iteblog.com/archives/8590.html

 

 

三、其他新特性

https://pgmanor.gitee.io/blog/2020/12/31/blog-spark-version-3/

 

posted @   guoyu1  阅读(84)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· .NET10 - 预览版1新功能体验(一)
历史上的今天:
2021-12-28 147. 对链表进行插入排序
点击右上角即可分享
微信分享提示