摘要: RDD(Resilient Distributed Datasets)弹性的分布式数据集,又称Spark core,它代表一个只读的、不可变、可分区,里面的元素可分布式并行计算的数据集。RDD是一个很抽象的概念,不易于理解,但是要想学好Spark,必须要掌握RDD,熟悉它的编程模型,这是学习Spark其他组件的基础 阅读全文
posted @ 2020-10-23 15:52 大数据学习与分享 阅读(894) 评论(0) 推荐(0) 编辑