摘要: Spark算子之aggregateByKey详解 一、介绍 根据源码中的注释介绍,总结下来,有这么几个点: 1. 该函数需要一个combine函数以及一个初始值 2. 函数可以返回一个与RDD中值类型不同的结果类型U 3. 我们需要一个针对每个分区合并操作,将单个分区中值(V)合并到该分区的聚合结果 阅读全文
posted @ 2021-12-16 23:17 郭小白 阅读(635) 评论(0) 推荐(0) 编辑