摘要:
Hive会将一个查询转化成一个或者多个阶段。这样的阶段可以是MapReduce阶段、抽样阶段、合并阶段、limit阶段,或者Hive执行过程中可能需要的其他阶段。默认情况下,Hive一次只会执行一个阶段。不过,某个特定的job可能包含众多的阶段,而这些阶段可能并非完全互相依赖的,也就是说有些阶段是可 阅读全文
摘要:
分桶规则 对分桶字段值进行哈希,哈希值除以桶的个数求余,余数决定了该条记录在哪个桶中,也就是余数相同的在一个桶中 分桶优点 提高join查询效率: 假设表A和表B进行join,join的字段为id条件: 两个表为大表 两个表都为分桶表 A表的桶数是B表桶数的倍数或因子 这样join查询时候,表A的每 阅读全文