Haippy - 博客园

Hbase 介绍（转载）

2011-12-05 16:02 by Haippy, 657 阅读, 0 推荐, 收藏, 编辑

摘要：hbase是bigtable的开源山寨版本。是建立的hdfs之上，提供高可靠性、高性能、列存储、可伸缩、实时读写的数据库系统。它介于nosql和RDBMS之间，仅能通过主键(row key)和主键的range来检索数据，仅支持单行事务(可通过hive支持来实现多表join等复杂操作)。主要用来存储非结构化和半结构化的松散数据。与hadoop一样，Hbase目标主要依靠横向扩展，通过不断增加廉价的商用服务器，来增加计算和存储能力。阅读全文

0 Comment

Oracle NoSQL Database (转载)

2011-12-05 15:55 by Haippy, 1571 阅读, 0 推荐, 收藏, 编辑

摘要：近日Oracle提供了不久前公布的NoSQL数据库的下载，目前只有企业版，开源的社区版还没提供，也就是说还看不到源码。不过根据文档也能大致了解这个NoSQL数据库怎么样。快速看了看，总结如下。阅读全文

0 Comment

数据分析与处理之二（Leveldb 实现原理）

2011-12-04 21:24 by Haippy, 111534 阅读, 33 推荐, 收藏, 编辑

摘要：首先，LevelDb是一个持久化存储的KV系统，和Redis这种内存型的KV系统不同，LevelDb不会像Redis一样狂吃内存，而是将大部分数据存储到磁盘上。其次，LevleDb在存储数据时，是根据记录的key值有序存储的，就是说相邻的key值在存储文件中是依次顺序存储的，而应用可以自定义key大小比较函数，LevleDb会按照用户定义的比较函数依序存储这些记录。再次，像大多数KV系统一样，LevelDb的操作接口很简单，基本操作包括写记录，读记录以及删除记录。也支持针对多条操作的原子批量操作。另外，LevelDb支持数据快照（snapshot）功能，使得读取操作不受写操作影响，可以在读操作过程中始终看到一致的数据。阅读全文

20 Comment

Storm : Twitter的实时数据处理工具(转载)

2011-12-04 21:09 by Haippy, 1517 阅读, 0 推荐, 收藏, 编辑

摘要：Twitter在9月19日的Strange Loop大会上公布Storm的代码。这个类似于Hadoop的即时数据处理工具是BackType开发的，后来被Twitter收购用于Twitter。阅读全文

0 Comment

Cassandra和HBase主要设计思路对比

2011-12-04 21:03 by Haippy, 760 阅读, 0 推荐, 收藏, 编辑

摘要：Cassandra和HBase主要设计思路对比阅读全文

0 Comment

IBM developerWorks 文章转载系列（二）

2011-12-04 20:57 by Haippy, 791 阅读, 0 推荐, 收藏, 编辑

摘要：寻找应用程序中占用时间最长的部分阅读全文

0 Comment

IBM developerWorks 文章转载系列（一）

2011-12-04 20:56 by Haippy, 928 阅读, 1 推荐, 收藏, 编辑

摘要：了解 STAB 和 DWARF 这两种流行调试格式的更多信息。了解如何调试和分析构成 DWARF 和 STAB 格式的 UNIX 可执行文件。对于处理编译器和调试器的程序员以及对读取或写入 DWARF 和 STAB 信息感兴趣的任何人，本文内容非常有用。阅读全文

0 Comment

[InfoQ]Twitter Storm：开源实时Hadoop （转载）

2011-12-04 20:55 by Haippy, 400 阅读, 0 推荐, 收藏, 编辑

摘要：Twitter将Storm正式开源了，这是一个分布式的、容错的实时计算系统，它被托管在GitHub上，遵循 Eclipse Public License 1.0。Storm是由BackType开发的实时处理系统，BackType现在已在Twitter麾下。GitHub上的最新版本是Storm 0.5.2，基本是用Clojure写的。阅读全文