Hadoop, Spark, MPI三种计算框架的特点以及分别适用于什么样的场景

a)     Hadoop
基于分布式文件系统HDFS的分布式批处理计算框架。适用于数据量大,SPMD(单程序多数据)的应用。
b)     Spark
基于内存计算的并行计算框架。适用于需要迭代多轮计算的应用。
c)      MPI
基于消息传递的并行计算框架。适用各种复杂应用的并行计算。支持MPMD( 多程序多数据) ,开发复杂度高

 

 

聚类算法分为几部分?

 

posted on 2017-03-25 15:17  楼兰过客  阅读(505)  评论(0编辑  收藏  举报

导航