摘要: 一、数据倾斜分析——mapJoin 1.背景 接上一个day的Join算法,我们的解决join的方式是:在reduce端通过pid进行串接,这样的话: 例如订单中的小米5卖的比较好(截止博客时间,已经是米7将出的时候了。),这样的话大部分的数据都流向了P0001的这个reduce上,而P0002 的 阅读全文
posted @ 2018-02-05 16:25 ---江北 阅读(897) 评论(0) 推荐(0) 编辑
摘要: 一、起步 引入依赖: 当然,一般可能项目中不会需要单独引入这个依赖,可能其他依赖自动引入了此包,请先检查,避免重复引入! 二、开始 文档:http://commons.apache.org/proper/commons-beanutils/javadocs/v1.9.3/apidocs/org/ap 阅读全文
posted @ 2018-02-05 14:51 ---江北 阅读(2602) 评论(0) 推荐(0) 编辑
TOP