紫杉

  博客园 :: 首页 :: 博问 :: 闪存 :: 新随笔 :: 联系 :: 订阅 订阅 :: 管理 ::

2014年7月4日

摘要: 二级索引与索引Join是多数业务系统要求存储引擎提供的基本特性,RDBMS早已支持,NOSQL阵营也在摸索着符合自身特点的最佳解决方案。这篇文章会以HBase做为对象来讨论如何基于Hbase构建二级索引与实现索引join。文末同时会列出目前已知的包括0.19.3版secondary index,IT... 阅读全文
posted @ 2014-07-04 16:31 紫杉 阅读(311) 评论(0) 推荐(0) 编辑

摘要: 所谓“时间相关多列数据”指的是同一个Key下具有多个属性数据,并且这些数据与时间具有相关性,多数场景是该Key对应在不同时间时刻的行为数据。在实际应用中,这类数据很多,例如电子商务网站上用户最近一段时间浏览的宝贝集合、访问的URL列表等。使用HBase存储此类数据时,有以下两种常用的方案:多行单列表... 阅读全文
posted @ 2014-07-04 16:20 紫杉 阅读(452) 评论(0) 推荐(0) 编辑

摘要: Hbase的访问方式1、Native Java API:最常规和高效的访问方式;2、HBase Shell:HBase的命令行工具,最简单的接口,适合HBase管理使用;3、Thrift Gateway:利用Thrift序列化技术,支持C++,PHP,Python等多种语言,适合其他异构系统在线访问... 阅读全文
posted @ 2014-07-04 14:07 紫杉 阅读(900) 评论(0) 推荐(0) 编辑

摘要: Hbase对Mapreduce API进行了扩展,方便Mapreduce任务读写HTable数据。一个简单示例:说明:从日志表中,统计每个IP访问网站目录的总数[java]view plaincopypackageman.ludq.hbase;importjava.io.IOException;im... 阅读全文
posted @ 2014-07-04 14:06 紫杉 阅读(296) 评论(0) 推荐(0) 编辑