2019 年 4月 10 日随笔档案 - kris12

2019年4月10日

摘要： Spark中三大数据结构： RDD；广播变量: 分布式只读共享变量；累加器：分布式只写共享变量；线程和进程之间 1. RDD 序列化 1) 闭包检查从计算的角度, 算子以外的代码都是在 Driver 端执行, 算子里面的代码都是在 Executor 端执行。那么在 scala 的函数式编程中阅读全文

posted @ 2019-04-10 08:45 kris12 阅读(759) 评论(0) 推荐(0) 编辑

kris12

Self-discipline gives me freedom.

公告