摘要: 最近老大让用Spark做一个ETL项目,搭建了一套只有三个结点Standalone模式的Spark集群做测试,基础数据量大概8000W左右。看了官方文档,Spark确实在Map-Reduce上提升了很多,可是官方明确提出了在Interactive Data方面性能提升最大。但是做ETL的数据之间是平... 阅读全文
posted @ 2015-04-23 23:59 errdev 阅读(2792) 评论(0) 推荐(0) 编辑