今日学习Spark中的广播变量:
使用场景:本地集合对象和分布式集合对象(RDD)进行关联的时候,需要将本地集合对象封装为广播变量
可以节省:
1.网络IO的次数
2.Eexcutor的内存占用
使用方法: