Github代码地址
摘要: 题记:google 的成功除了一个个出色的创意外,还因为有 Jeff Dean 这样的软件架构天才。 官方的 Google Reader blog 中有对BigTable 的解释。这是Google 内部开发的一个用来处理大数据量的系统。这种系统适合处理半结构化的数据比如 RSS 数据源。 以下发言 阅读全文
posted @ 2017-07-05 11:50 @小葱拌豆腐 阅读(514) 评论(0) 推荐(0) 编辑
摘要: MapReduce:超大机群上的简单数据处理 摘要 MapReduce是一个编程模型,和处理,产生大数据集的相关实现.用户指定一个map函数处理一个key/value对,从而产生中间的key/value对集.然后再指定一个reduce函数合并所有的具有相同中间key的中间value.下面将列举许多可 阅读全文
posted @ 2017-07-05 11:50 @小葱拌豆腐 阅读(839) 评论(0) 推荐(0) 编辑
摘要: Google文件系统 GFS是一个可扩展的分布式文件系统,用于大型的、分布式的、对大量数据进行访问的应用。它运行于廉价的普通硬件上,但可以提供容错功能。它可以给大量的用户提供总体性能较高的服务。 1、设计概览 (1)设计想定 GFS与过去的分布式文件系统有很多相同的目标,但GFS的设计受到了当前及预 阅读全文
posted @ 2017-07-05 11:48 @小葱拌豆腐 阅读(1773) 评论(0) 推荐(0) 编辑

霸气