摘要: Spark是什么? 基于内存计算的大数据并行计算框架 2009年诞生 全栈多计算范式的高效数据流水线 Spark相比MapReduce的优势 1.中间结果输出 2.数据格式和内存布局 3.执行策略 4.任务调度的开销 Spark生态系统BDAS Berkeley Data Analytics Sta 阅读全文
posted @ 2016-07-22 14:48 BrightWise 阅读(164) 评论(0) 推荐(0) 编辑