2.7日结

这里的闭包指的是,当Executor在执行的过程中需要用到Driver内存里面的变量的话,就要求这个变量必须要先序列化,否则就会报错

这里即使集合里面没有数据,也会报错,因为在执行foreach之前会有一次检测,如果发现有scala对象未序列化,就报错,也就不会触发foreach方法

另外这里要明白为什么rdd里面的方法才叫算子,因为算子方法在executor端执行。

P92说明了RDD之间的依赖和血缘关系

 

 窄依赖指下游rdd里面的数据只依赖于一个上游的rdd,宽依赖(shuffle)指的是上游的数据被多个下游的rdd所依赖。

如下有两张图,分别是宽依赖和窄依赖,宽依赖因为要经过shuffle,那么需要分阶段,我以WordCount为例,在进行reduceBYKey之前是一个阶段,然后聚合是另一个阶段(只有一个阶段结束之后才可以执行下一个阶段)

而窄依赖的话,本身不同任务之间不需要相互等待,异步执行完毕即可,所以窄依赖只需要两个Task任务,而涉及宽依赖的RDD中需要更多的Task.

             

 cache持久化,不一定用于对象重用,也有可能在执行行动算子的时候数据执行较长或者比较重要的场合,也可以采用持久化的操作(默认是在内存)

 

 

 学习完毕RDD,之后又了解到累加器

 

 

posted @   -她的梦-  阅读(3)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· Ollama——大语言模型本地部署的极速利器
· 使用C#创建一个MCP客户端
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· Windows编程----内核对象竟然如此简单?
· ollama系列1:轻松3步本地部署deepseek,普通电脑可用
  1. 1 碧天伴走 MyGO!!!!!
  2. 2 影色舞 MyGO!!!!!
  3. 3 詩超絆 MyGO!!!!!
  4. 4 迷路日々 MyGO!!!!!
  5. 5 歌いましょう鳴らしましょう MyGO!!!!!
  6. 6 壱雫空 MyGO!!!!!
迷路日々 - MyGO!!!!!
00:00 / 00:00
An audio error has occurred, player will skip forward in 2 seconds.

作词 : 藤原優樹

作曲 : 松坂康司

编曲 : 松坂康司

迷いながら 戸惑いながら歩く

めいろの中で 僕らは居合わせてた

名前のない感情 ああ 抱きしめてる

ちいさな一瞬 あつめたい

こぼれおちた 街のすみで

こぼれおちた 街のすみで

震えていた 昨日も

ちっぽけだって 隠さないでいたいよ

ちっぽけだって 隠さないでいたいよ

はみ出したまま 不揃いな僕らでも

いびつな言葉で ズレては すれ違ってさ

傷つけたことに 傷ついてる

それでもこの手を ほどかない

独りよがり あてもなくて

独りよがり あてもなくて

机の中 しまい込んでいた

ぐるぐる とまらない

ぐるぐる とまらない

くよくよ とめどない

隠れて 怯える 欠片と

僕はここで うたうよ

僕の中で うごめいていた熱が

僕の中で うごめいていた熱が

音に放たれ 覚束ない声色で

叫びだした

迷子のまま 曲がりくねった道でも

迷子のまま 曲がりくねった道でも

諦めなかった 僕らのしるしだから

まだ言葉にならない無数の声が

まだ言葉にならない無数の声が

胸の中 ああ 羽ばたく時を待ってる

ぎこちなくて 消えそうになる足音でも

隣で一緒に 奏でたいよ

迷っても 一生離れない

迷っても 一生離れない

点击右上角即可分享
微信分享提示