摘要: 转载: https://blog.csdn.net/zhyooo123/article/details/82703723 阅读全文
posted @ 2020-09-28 16:05 Loading~ 阅读(115) 评论(0) 推荐(0) 编辑
摘要: 执行流程 client模式提交任务后,会在客户端启动Driver进程。 Driver会向Master申请启动Application启动的资源。 资源申请成功,Driver端将task发送到worker端执行。 worker将task执行结果返回到Driver端。 总结 client模式适用于测试调试 阅读全文
posted @ 2020-09-28 14:22 Loading~ 阅读(764) 评论(0) 推荐(0) 编辑
摘要: 转载 :https://blog.csdn.net/qq_27639777/article/details/82319560 Spark Cache的几点思考 Spark涵盖了大数据领域内的离线批处理、流式计算、机器学习和图计算等不同的场景,已经成为大数据计算领域首选的计算框架。由于spark框架的 阅读全文
posted @ 2020-09-28 12:01 Loading~ 阅读(409) 评论(0) 推荐(0) 编辑
摘要: 回顾MR 对比Spark 核心RDD 理解RDD 一个 RDD 可以简单的理解为一个分布式的元素集合. RDD 表示只读的分区的数据集,对 RDD 进行改动,只能通过 RDD 的转换操作, 然后得到新的 RDD, 并不会对原 RDD 有任何的影响. 在 Spark 中, 所有的工作要么是创建 RDD 阅读全文
posted @ 2020-09-28 11:48 Loading~ 阅读(120) 评论(0) 推荐(0) 编辑