摘要:
其实就是from表时,可以插入到多个表。 sql语句的模板如下:from historyinsert overwrite sales select * where actino='purchased'inesrt overwrite credits select * where action = '... 阅读全文
摘要:
将set hive.limit.optimize.enable=true 时,limit限制数据时就不会全盘扫,而是根据限制的数量进行抽样。同时还有两个配置项需要注意:1、hive.limit.row.max.size 我理解这个是控制最大的抽样数量2、 hive.limit.optimize.l... 阅读全文
摘要:
可以通过修改set hive.exec.parallel=true来修改并行度。如果job中并行执行的阶段增多,那么集群利用率会增加。 阅读全文