摘要:
在计算rdd.foreach的时候,rdd被split到了不同的计算节点上,在此之前spark会计算出来闭包,然后将闭包传递给每个Node进行计算。这个闭包当中就包含了全局变量counter的副本,那么在集群上修改的仅仅是副本,最终driver中的counter是不会被改变的。如果在单机上运行,也取 阅读全文
摘要:
在计算rdd.foreach的时候,rdd被split到了不同的计算节点上,在此之前spark会计算出来闭包,然后将闭包传递给每个Node进行计算。这个闭包当中就包含了全局变量counter的副本,那么在集群上修改的仅仅是副本,最终driver中的counter是不会被改变的。如果在单机上运行,也取 阅读全文
|