摘要: 1. 只支持相等JOIN。2. 多表连接当使用不同的列进行JOIN时,会产生多个MR作业。3. 最后的表的数据是从流中读取,而前面的会在内存中缓存,因此最好把最大的表放在最后。SELECT /*+ STREAMTABLE(a) */ a.val, b.val, c.val FROM a JOIN b ON (a.key = b.key1) JOIN c ON (c.key = b.key1)//暗示4. JOIN在WHERE子句前进行处理。SELECT a.val, b.val FROM a LEFT OUTER JOIN b ON (a.key=b.key) WHERE a.ds=' 阅读全文
posted @ 2013-04-03 16:20 淩風 阅读(10396) 评论(0) 推荐(0) 编辑