摘要: 1.分布式代码执行的重要特征代码在集群上运行,是分布式运行的在spark中,非任务处理部分由driver执行(非rdd代码)任务处理部分由executor执行(rdd代码)executor的数量可以很多,所以人物的计算是分布式在运行的2.pyspark的架构体系python on spark dri 阅读全文