2018年6月19日

spark技术总结(1)

摘要: 1. 请描述spark RDD原理与特征 RDD为Resilient Distributed Datasets缩写,译文弹性分布式数据集。 他是spark系统中的核心数据模型之一,另外一个是DAG模型。 它是“只读”,“分区”的数据集合。其类内部有5个部分组成: 1. 一组partition par 阅读全文

posted @ 2018-06-19 17:21 xf-xrh-xf 阅读(379) 评论(0) 推荐(0) 编辑

导航