摘要: 1. 主要参考资料http://spark.incubator.apache.org/docs/latest/scala-programming-guide.htmlhttp://www.eecs.berkeley.edu/Pubs/TechRpts/2011/EECS-2011-82.pdf2. ... 阅读全文
posted @ 2015-11-14 11:42 子健儿 阅读(406) 评论(0) 推荐(0) 编辑
摘要: 什么是SparkSpark是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架,Spark基于map reduce算法实现的分布式计算,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是Job中间输出和结果可以保存在内存... 阅读全文
posted @ 2015-11-14 10:39 子健儿 阅读(264) 评论(0) 推荐(0) 编辑