摘要: Resilient Distributed Datasets RDD本质上是一组数据的Spark表示,分布在多台机器上,使用API​​让您对其进行操作。RDD可以来自任何数据源,例如文本文件,通过JDBC的数据库等。 其定义为: 弹性分布式数据集(RDD)是Spark的基本数据结构。它是一个不可变的 阅读全文
posted @ 2019-03-24 23:55 twoseee 阅读(224) 评论(0) 推荐(0) 编辑