摘要: Spark算子分为两大类,本文介绍Action类算子。 (1)reduce算子 按照官网的解释,传入的参数是一个函数,一个双参数,返回值唯一的函数,建议,该函数是可交换的,是可联合的,如此,才能实现正确的并行计算。 这里的函数,我平时用过加法操作,最大值操作,最小值操作;记得大数据里提过这个概念,诸 阅读全文
posted @ 2019-10-24 10:31 小路学习 阅读(760) 评论(0) 推荐(0) 编辑