超越MapReduce的并行大数据处理

9.1:基于迭代处理平台的并行算法

 

 

不动点:

 

核心观点:

 

迭代例析:

1.PageRank(网络连接分析)

mapreduce中的实现:

存在的问题:

2.传递闭包

存在的问题:

3.K-means算法

存在的问题:

 

解决方法:缓存迭代

 

 

Reducer输入缓存:

 

Reducer的输出缓存:

 

Mapper的输入缓存:

 

体系结构:

 

9.2基于图处理平台的并行算法

 

 

pregel和mapreduce的不同之处:

 

系统的安装:

 

 

例子:计算子图同构

方法概述:

 

1.查询分解:

2.搜索:

3.join:

 

posted @ 2018-12-17 22:53  cellphone7  阅读(347)  评论(0编辑  收藏  举报