HBase概述

1. 概述

HBase是基于Hadoop的一个非关系型数据库(NoSQL数据库),HBase存储底层也是基于HDFS存储的。HBase和Hive很像,Hive是数据仓库

2. HBase中的基本概念

  • NameSpace:类似于关系型数据库的Database,每个命名空间下有多个表
  • Table:表名
  • Row:每一行代表一个数据对象,每一行都是以一个行键来进行唯一标识的
  • Column:HBase中的每一列都由Column Family(列族)和Column Qualifier(列限定符)进行限定
  • RowKey:可以唯一标识一行记录,不可被改变,改变的唯一方式,就是删除,然后再插入。
  • Column Family:在定义HBase表的时候需要提前设置好列族,表中所有的列都需要组织在列族里面,在文件系统中,一个Column Family中的Column是存储在一起的。列簇一旦确定好,就不允许更改了,因为更改会影响到真实的物理存储。
  • Column Qualifier:列族中的数据通过列表示来进行映射,Column Qualifer就是key,存储的数据就是对应的value
  • Cell:由{rowkey, column Family:column Qualifier, time Stamp} 唯一确定的单元。cell 中的数据是没有类型的,全部是字节码形式存储。
  • TimeStamp:每一个值都有一个timestamp,作为该值特定版本的标识符。

3. 画图理解

4. HBase架构体系

见笔记和文档

posted @ 2022-09-12 17:03  jsqup  阅读(43)  评论(0编辑  收藏  举报