初识Spark(Spark系列)
摘要:
1.SparkSpark是继Hadoop之后,另外一种开源的高效大数据处理引擎,目前已提交为apach顶级项目。效率:据官方网站介绍,Spark是Hadoop运行效率的10-100倍(随内存计算、磁盘计算的不同而不同)。语言:支持的语言包括java、scala、python等,此外还支持SQL查询。... 阅读全文
posted @ 2014-11-13 20:07 _Deron_ 阅读(343) 评论(0) 推荐(0) 编辑