2015 年 4月 23 日随笔档案 - errdev

2015年4月23日

摘要：最近老大让用Spark做一个ETL项目，搭建了一套只有三个结点Standalone模式的Spark集群做测试，基础数据量大概8000W左右。看了官方文档，Spark确实在Map-Reduce上提升了很多，可是官方明确提出了在Interactive Data方面性能提升最大。但是做ETL的数据之间是平... 阅读全文

posted @ 2015-04-23 23:59 errdev 阅读(2795) 评论(0) 推荐(0) 编辑

ERRDEV

Coding the world

公告