2017年2月13日
摘要: 今天被问到hive的数据倾斜,觉得自己对这块理解比较欠缺,某度了一下进行深入学习: hive在跑数据时经常会出现数据倾斜的情况,使的作业经常reduce完成在99%后一直卡住,最后的1%花了几个小时都没跑完,这种情况就很可能是数据倾斜的原因,解决方法要根据具体情况来选择具体的方案 1、join的ke 阅读全文
posted @ 2017-02-13 17:38 杰我天下 阅读(400) 评论(0) 推荐(0) 编辑