摘要: 从一个表里group by 之后 计算累加值、去重值:为了效率设置并行:set hive.exec.parallel=true(可选:set hive.exec.parallel.thread.number=16)、set hive.groupby.skewindata=true、set hive.... 阅读全文
posted @ 2015-08-20 18:06 闪电战 阅读(3764) 评论(1) 推荐(0) 编辑