今日学习Spark中的广播变量:

使用场景:本地集合对象和分布式集合对象(RDD)进行关联的时候,需要将本地集合对象封装为广播变量

可以节省:

1.网络IO的次数

2.Eexcutor的内存占用

使用方法: