RDD与DataFrame

RDD:分布式对象集合;

   解决了:减少中间计算结果处理所需的开销

         数据存在内存,提供一个通用的抽象的数据结构

   惰性求值

DataFrame:分布式Row对象集合

   服务于:SparkSQL

posted @ 2019-03-26 21:24  丨Kouch  阅读(121)  评论(0编辑  收藏  举报