摘要: 9.1:基于迭代处理平台的并行算法 不动点: 核心观点: 迭代例析: 1.PageRank(网络连接分析) mapreduce中的实现: 存在的问题: 2.传递闭包 存在的问题: 3.K-means算法 存在的问题: 解决方法:缓存迭代 Reducer输入缓存: Reducer的输出缓存: Mapp 阅读全文
posted @ 2018-12-17 22:53 cellphone7 阅读(347) 评论(0) 推荐(0) 编辑
摘要: 8.1 连接(join)算法 笛卡尔积的运算: 笛卡尔积运算+约束->连接操作: θ连接: 自然连接(一种特殊的θ连接): Map-Reduce-Merge关系连接算法的实现: Hash Join: 方式一: 方式二: MapReduce上的二路join: MapReduce上的多路join: 实现 阅读全文
posted @ 2018-12-17 20:23 cellphone7 阅读(625) 评论(0) 推荐(0) 编辑