spark RDD操作的底层实现原理

RDD操作闭包外部变量原则

RDD相关操作都需要传入自定义闭包函数（closure），如果这个函数需要访问外部变量，那么需要遵循一定的规则，否则会抛出运行时异常。闭包函数传入到节点时，需要经过下面的步骤：

注意：外部变量在闭包内的修改不会被反馈到驱动程序。

简而言之，就是通过网络，传递函数，然后执行。

posted @ 2016-11-07 15:15 bonelee 阅读(1267) 评论(0) 收藏举报

刷新页面返回顶部

将者，智、信、仁、勇、严也。