2016年11月14日
摘要: 1、代码中尽量避免group by函数,如果需要数据聚合,group形式的为rdd.map(x=>(x.chatAt(0),x)).groupbyKey().mapValues((x=>x.toSet.size)).collection() 改为 rdd.map(x=>(x.chatAt(0),x) 阅读全文
posted @ 2016-11-14 01:16 松伯 阅读(2377) 评论(0) 推荐(0) 编辑