摘要:
丐帮 - Apache Software Foundation在我开始学习Java的时候,Apache的Jakarta子项目还很弱小,Apache的头牌是Apache HTTPD Server(至今也还是头牌),如今已经成了Java开源江湖第一大帮。Apache势力庞大,背后有众多大厂商的支持,例如IBM资助了apache 的好几个 project,Sun则和tomcat合作密切,而BEA砸下重资在Beehive上面。有了官府的支持,Apache理所当然了成了第一大帮。不过 Apache的问题就是组织成员太复杂了,旗下各个project来自三山五岳,良莠不齐,甚至各个门下子弟还经常发生冲突,漫 阅读全文
摘要:
BigTable是非关系的数据库。是一个稀疏的、分布式的、持久化存储的多维度排序Map。特点: 1、适合大规模海量数据,PB级数据; 2、分布式、并发数据处理,效率极高; 3、易于扩展,支持动态伸缩; 4、适用于廉价设备; 5、适合于读操作,不适合写操作。 6、不适用于传统关系数据库;BigTable两个开源实现: HBase:Java语言开发 Hypertable:Boost C++开发MongoDB是一个基于分布式文件存储的数据库。由C++语言编写。旨在为WEB应用提供可扩展的高性能数据存储解决方案。 阅读全文
摘要:
B树、B-树、B+树、B*树 介绍、比较:B树: 二叉树,每个结点只存储一个关键字,等于则命中。B-树: 多路搜索树,每个结点存储M/2到M个关键字,非叶子结点存储指向关键字范围的子结点; 所有关键字在整棵树中出现,且只出现一次,非叶子结点可以命中。B+树: 在B-树的基础上,为叶子结点增加链表指针,所有关键字都在叶子结点中出现,非叶子结点作为叶子结点的索引; B+树总是到叶子结点才命中B*树: 在B+树的基础上,为非叶子结点也增加链表指针,将结点的最低利用率从1/2提高到2/3。数据库索引的种类有两种基本的索引结构,也就是索引文件的保存方式,一个是顺序索引,另外一个是散列索引。... 阅读全文
摘要:
一个分布式系统基础架构,由Apache基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有着高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上。而且它提供高传输率(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS放宽了(relax)POSIX的要求(requirements)这样可以流的形式访问(streaming acces 阅读全文