摘要: hive.groupby.skewindata 用于数据存在倾斜的情况,比如:select ip, count(*) from access_log group by ip 如果某些ip地址对应的访问量非常大,相应的 reducer 执行就会很慢。可以通过将该变量设置为 true 来解决这个问... 阅读全文
posted @ 2015-09-18 15:57 cbffr 阅读(320) 评论(0) 推荐(0) 编辑