Hadoop HBase概念学习系列之HBase里的长表VS宽表VS窄表(十五)
有时候啊,HBase表的设计方案通常,还会考虑如下一些因素,当然,这只是考虑范围里的部分呢。
更多的行还是更多的版本?后者使用了HBase自带的功能。但是需要在列簇中定义最大版本数,这样做可能有风险。最好的做法是版本使用多行存储,这需要把时间戳作为行键的一部分,数据检索模式定义了时间戳如何定义为行键的一部分以及应该位于行键的一部分。
更多行或是每行包含更多列?HBase支持每行包含数百万列,并且每一列都可以有列标识。
以行为列的设计?这是一种介于多行和多列的折衷方案。我们可以举一个日志数据库的例子,这个数据库中存储了所有系统中机器生成的日志。我们可以将系统标识(产生日志的系统)和时间范围(比如间隔15分钟)联合起来定义行,每一列代表一种日志事件。
作者:大数据和人工智能躺过的坑
出处:http://www.cnblogs.com/zlslch/
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文链接,否则保留追究法律责任的权利。
如果您认为这篇文章还不错或者有所收获,您可以通过右边的“打赏”功能 打赏我一杯咖啡【物质支持】,也可以点击右下角的【好文要顶】按钮【精神支持】,因为这两种支持都是我继续写作,分享的最大动力!