摘要: RDD:分布式对象集合; 解决了:减少中间计算结果处理所需的开销 数据存在内存,提供一个通用的抽象的数据结构 惰性求值 DataFrame:分布式Row对象集合 服务于:SparkSQL 阅读全文
posted @ 2019-03-26 21:24 丨Kouch 阅读(121) 评论(0) 推荐(0) 编辑