摘要: 整个大数据处理的体系,按我的理解可以分为两个部分,一个是分布式存储系统、另一个是分布式计算框架。分布式存储系统主流是HadoopDFS,其他还有Ceph和Swift。分布式计算框架主流是MapReduce,Storm和Spark。 ... 阅读全文
posted @ 2016-11-13 14:36 yuerspring 阅读(301) 评论(0) 推荐(0) 编辑