Spark基础
摘要:
RDD是只读记录分区的集合 ,只能通过在其他RDD执行确定的转换操作(如map、join和groupBy)或直接读取外部存储而创建,然而这些限制使得实现容错的开销很低。与分布式共享内存系统需要付出高昂代价的检查点和回滚机制不同, RDD通过Lineage来重建丢失的分区 ; 一个RDD包含如何从其他 阅读全文
posted @ 2019-09-29 16:32 LeonNew 阅读(150) 评论(0) 推荐(0) 编辑