摘要: 一、join优化 1. 使用相同的连接键当对3个或者更多个表进行join连接时,如果每个on子句都使用相同的连接键的话,那么只会产生一个MapReduce job。 2. 尽量尽早地过滤数据减少每个阶段的数据量,对于分区表要加分区,同时只选择需要使用到的字段。 3. 尽量原子化操作尽量避免一个SQL 阅读全文
posted @ 2022-06-14 16:21 黑水滴 阅读(380) 评论(0) 推荐(0) 编辑