摘要:   本章介绍了如何使用键值对RDD,Spark中很多操作都基于此数据类型。键值对RDD通常在聚合操作中使用,而且我们经常做一些初始的ETL(extract(提取),transform(转换)和load(加载))来把数据转化成键值对格式。键值对中有很多新操作(如,计算每个产品的评价 阅读全文
posted @ 2018-02-26 14:08 Tikko 阅读(994) 评论(0) 推荐(0) 编辑