Hadoop和HBase、HBase的应用场景、Hbase对于RDBMS(关系数据库管理系统)对比Hive

Hadoop和HBase

  • HBase是基于Hadoop集群之上来搭建的
  • Hadoop有一些局限性的:
    • 做一些批量的数据处理,吞吐量比较高,但是它对随机查询、实时操作性能是不行的
  • HBase是NoSQL数据库的一种,它跟传统的RDBMS(关系数据库管理系统)有很大的差别
  • 不支持JOIN的,摒弃了关系型模型,而且在HBase中只有一种数据类型:byte[]
  • HBase可以用来存储非常大的表,上亿行的数据、有超过百万列,而且它常用在实时数据处理中。因为它的读写是很快的。

HBase的应用场景

  • 只要有海量数据存储,而且需要快速的写入以及快速的读取场景,就很适合HBase
  • 但要记住NoSQL的特点:对事务的支持性较弱的
  • 可以用来存储爬虫的数据、点赞/转发、银行转账订单....

Hbase对于RDBMS(关系数据库管理系统)对比Hive

  • RDBMS是关系型数据库支持join、ACID、有schema(创建表的时候必须要指定有哪些列、列是什么类型)...、支持二级索引
  • HBase不支持join的、也不支持ACID、对事务支持有限,无schema(创建表的时候,无需去指定列、列类型)、原生就支持分布式存储的,所以可以用来存储海量数据,同时也兼顾了快速查询、写入的功能

对比Hive:

  • Hive主要用于OLAP,HBase主要用于OLTP,HBase是可以直接接入到业务系统的
posted @ 2022-02-26 15:03  赤兔胭脂小吕布  阅读(85)  评论(0编辑  收藏  举报