2019 年 6月 7 日随笔档案 - ZacksTang

2019年6月7日

摘要： Spark 允许用户为driver（或主节点）编写运行在计算集群上，并行处理数据的程序。在Spark中，它使用RDDs代表大型的数据集，RDDs是一组不可变的分布式的对象的集合，存储在executors中（或从节点）。组成RDDs的对象称为partitions，并可能（但是也不是必须的）在分布式系统阅读全文

posted @ 2019-06-07 15:48 ZacksTang 阅读(2841) 评论(0) 推荐(0) 编辑

ZacksTang

公告