摘要: 其实就是from表时,可以插入到多个表。 sql语句的模板如下:from historyinsert overwrite sales select * where actino='purchased'inesrt overwrite credits select * where action = '... 阅读全文
posted @ 2015-12-17 17:14 HarkLee 阅读(475) 评论(0) 推荐(0) 编辑
摘要: 将set hive.limit.optimize.enable=true 时,limit限制数据时就不会全盘扫,而是根据限制的数量进行抽样。同时还有两个配置项需要注意:1、hive.limit.row.max.size 我理解这个是控制最大的抽样数量2、 hive.limit.optimize.l... 阅读全文
posted @ 2015-12-17 17:12 HarkLee 阅读(2309) 评论(0) 推荐(0) 编辑
摘要: 可以通过修改set hive.exec.parallel=true来修改并行度。如果job中并行执行的阶段增多,那么集群利用率会增加。 阅读全文
posted @ 2015-12-17 17:04 HarkLee 阅读(1984) 评论(0) 推荐(1) 编辑