摘要: 共性: 1、RDD、DataFrame、Dataset全都是spark平台下的分布式弹性数据集,为处理超大型数据提供便利 2、三者都有惰性机制,在进行创建、转换,如map方法时,不会立即执行,只有在遇到Action如foreach时,三者才会开始遍历运算,极端情况下,如果代码里面有创建、转换,但是后 阅读全文
posted @ 2019-08-12 10:31 力扛九鼎 阅读(915) 评论(0) 推荐(0) 编辑