potatoknight

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2018年10月29日

摘要: 在计算rdd.foreach的时候,rdd被split到了不同的计算节点上,在此之前spark会计算出来闭包,然后将闭包传递给每个Node进行计算。这个闭包当中就包含了全局变量counter的副本,那么在集群上修改的仅仅是副本,最终driver中的counter是不会被改变的。如果在单机上运行,也取 阅读全文
posted @ 2018-10-29 10:20 potatoknight 阅读(286) 评论(0) 推荐(0) 编辑