摘要: Bigtable:一个分布式的结构化数据存储系统译者:alex摘要Bigtable是一个分布式的结构化数据存储系统,它被设计用来处理海量数据:通常是分布在数千台普通服务器上的PB级的数据。Google的很多项目使用Bigtable存储数据,包括Web索引、Google Earth、Google Fi... 阅读全文
posted @ 2012-02-09 12:05 夏至冬末 阅读(286) 评论(0) 推荐(0) 编辑
摘要: Google MapReduce中文版 译者: alex 摘要MapReduce是一个编程模型,也是一个处理和生成超大数据集的算法模型的相关实现。用户首先创建一个Map函数处理一个基于key/value pair的数据集合,输出中间的基于key/value pair的数据集合;然后再创建一个Redu... 阅读全文
posted @ 2012-02-09 11:54 夏至冬末 阅读(293) 评论(0) 推荐(0) 编辑
摘要: The Google File System中文版译者:alex摘要我们设计并实现了Google GFS文件系统,一个面向大规模数据密集型应用的、可伸缩的分布式文件系统。GFS虽然运行在廉价的普遍硬件设备上,但是它依然了提供灾难冗余的能力,为大量客户机提供了高性能的服务。虽然GFS的设计目标与许多传... 阅读全文
posted @ 2012-02-09 11:14 夏至冬末 阅读(264) 评论(0) 推荐(0) 编辑
摘要: HBase简介HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。HBase是Google Bigtable的开源实现,类似Google Bigtable利用GFS作为其文件... 阅读全文
posted @ 2012-02-09 10:42 夏至冬末 阅读(167) 评论(0) 推荐(0) 编辑
摘要: 如果想详细了解hbase的安装:http://abloz.com/hbase/book.html 和官网http://hbase.apache.org/1. 快速单击安装在单机安装Hbase的方法。会引导你通过shell创建一个表,插入一行,然后删除它,最后停止Hbase。只要10分钟就可以完成以下... 阅读全文
posted @ 2012-02-09 10:16 夏至冬末 阅读(281) 评论(0) 推荐(0) 编辑