摘要: Spark是一个通用且高速的大数据处理引擎,它采用了内存计算技术和DAG执行技术,大大提高了大数据处理速度,其效率在某些情况下是hadoop mapreduce引擎的10倍到100倍。此外,Spark还内建了例如MLlib,Spark SQL, Spark Streaming,GraphX等工具,为... 阅读全文
posted @ 2016-01-23 14:32 codingcat 阅读(272) 评论(0) 推荐(0) 编辑