摘要: 1.spark 开源的分布式cluster(集群)运算框架 2.spark相对于Hadoop的优势 数据处理逻辑的代码非常简短 提供很多转换和动作,而hadoop只提供Map和Reduce,表达力欠缺 一个job可以包含多个转换操作,在调度时可以生成多个stage,多个map操作的RDD分区不变,可 阅读全文
posted @ 2019-06-01 10:20 番薯大大 阅读(335) 评论(0) 推荐(0) 编辑