摘要: 1.collect算子 *使用foreachACTION操作 ,collect在远程集群中遍历RDD的元素 *使用collect操作,将分布式在远程集群中的数据拉取到本地 *这种方式不建议使用,如果数据量大,会使用大量 的网络带宽 *这种方式不建议使用。 2.count * 这个是一个action, 阅读全文
posted @ 2018-04-05 14:19 kwdeep 阅读(234) 评论(0) 推荐(0) 编辑