125学习总结

1.分布式代码执行的重要特征

代码在集群上运行,是分布式运行的

在spark中,非任务处理部分由driver执行(非rdd代码)

任务处理部分由executor执行(rdd代码)

executor的数量可以很多,所以人物的计算是分布式在运行的

2.pyspark的架构体系

python on spark driver 端由jvm执行,executor端由jvm命令转发,底层由python解释器进行工作

Spark core

posted @   代不动码  阅读(5)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· Ollama——大语言模型本地部署的极速利器
· 使用C#创建一个MCP客户端
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· Windows编程----内核对象竟然如此简单?
· ollama系列1:轻松3步本地部署deepseek,普通电脑可用
点击右上角即可分享
微信分享提示