摘要: Spark是一个内存迭代式运算框架,通过RDD来描述数据从哪里来,数据用那个算子计算,计算完的数据保存到哪里,RDD之间的依赖关系。他只是一个运算框架,和storm一样只做运算,不做存储。 Spark程序可以运行在Yarn、standalone、mesos等平台上,standalone是Spark提 阅读全文
posted @ 2016-10-29 22:03 水分子Andy 阅读(824) 评论(0) 推荐(0) 编辑