Hbase简介

1. HBase简介

1.1 hbase的概念

  • hbase基于Google的BigTable论文,是建立的hdfs之上,提供高可靠性高性能列存储可伸缩实时读写的分布式数据库系统。在需要实时读写、随机访问超大规模数据集时,可以使用hbase。
  • hbase 是一个 kv 数据库。

1.2 hbase的特点

  • 海量存储

    • 可以存储大批量的数据
  • 列式存储

    • hbase表的数据是基于列族进行存储的,列族是在列的方向上的划分。
  • 极易扩展

    • 底层依赖HDFS,当磁盘空间不足的时候,只需要动态增加datanode节点服务(机器)就可以了
    • 可以通过增加服务器来提高集群的存储能力
  • 高并发

    • 支持高并发的读写请求
  • 数据的多版本

    • hbase表中的数据可以有多个版本值,默认情况下是根据版本号去区分,版本号就是插入数据的时间戳
  • 数据类型单一

    • 所有的数据在hbase中是以字节数组进行存储

2. hbase整体架构

  • 1、Client

    • 客户端

      • Client包含了访问Hbase的接口,提供便捷的hbase访问

      • 另外Client还维护了对应的cache来加速Hbase的访问,比如cache的.META.元数据的信息

  • 2、Zookeeper

    • zookeeper集群
      • 作用
        • 实现了HMaster的高可用

        • 保存了hbase的元数据信息,是所有hbase表的寻址入口

        • 对HMaster和HRegionServer实现了监控

  • 3、HMaster

    • hbase集群的老大

      • 作用

        • 为HRegionServer分配Region
        • 维护整个集群的负载均衡
        • 维护集群的元数据信息
        • 发现失效的Region,并将失效的Region分配到正常的HRegionServer上
  • 4、HRegionServer

    • hbase集群中的小弟

      • 负责管理Region
      • 接受客户端的读写数据请求
      • 切分在运行过程中变大的region
  • 5、Region

    • hbase集群中分布式存储的最小单元
posted @ 2020-05-23 17:06  这个小仙女真可爱  阅读(359)  评论(0编辑  收藏  举报