12 2023 档案

摘要:介绍 Distributed MapJoin是MapJoin的升级版,适用于大表Join中表的场景,二者的核心目的都是为了减少大表侧的Shuffle和排序。 注意事项 (1) Join两侧的表数据量要求不同,大表侧数据在10 TB以上,中表侧数据在[1 GB, 100 GB]范围内。 (2) 小表侧 阅读全文
posted @ 2023-12-22 15:58 业余砖家 阅读(191) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示