摘要: 三者的共性1、RDD、DataFrame、Dataset 全都是 spark 平台下的分布式弹性数据集,为处理超大型数据提供便利 2、三者都有惰性机制,在进行创建、转换,如 map 方法时,不会立即执行,只有在遇到 Action 如 foreach 时,三者才会开始遍历运算。 3、三者都会根据 sp 阅读全文
posted @ 2020-03-25 15:37 再见傅里叶 阅读(1031) 评论(0) 推荐(0) 编辑