摘要: spark特点与应用场景 Spark是通用的并行化计算框架,基于MapReduce实现分布式计算,其中间结果可以保存在内存中,从而不再需要读写HDFS。 特点: 简单方便,使用scala语言。(与RDD很好结合) 计算速度快,中间结果缓存在内存中。 高错误容忍。 操作丰富。 广播,每个节点可以保留一 阅读全文
posted @ 2017-07-06 21:04 肖咏卓 阅读(697) 评论(0) 推荐(0) 编辑