摘要:
场景: 本地集合对象 和 分布式集合对象(RDD) 进行关联的时候需要将本地集合对象 封装为广播变量可以节省:1. 网络IO的次数2. Executor的内存占用 阅读全文
摘要:
进程和线程是操作系统中的两个基本概念,他们都是用来完成执行任务的,但是有所区别。进程是资源分配的最小单位,它代表 CPU 所能处理的单个任务。每个进程有自己的独立地址空间,每启动一个进程,系统就会为它分配地址空间,建立数据表来维护代码段、堆栈段和数据段。而线程是进程中执行运算的最小单位,它是被系统独 阅读全文
摘要:
阅读全文
摘要:
阅读全文