Hadoop和HBase、HBase的应用场景、Hbase对于RDBMS(关系数据库管理系统)对比Hive
Hadoop和HBase
- HBase是基于Hadoop集群之上来搭建的
- Hadoop有一些局限性的:
- 做一些批量的数据处理,吞吐量比较高,但是它对随机查询、实时操作性能是不行的
- HBase是NoSQL数据库的一种,它跟传统的RDBMS(关系数据库管理系统)有很大的差别
- 不支持JOIN的,摒弃了关系型模型,而且在HBase中只有一种数据类型:byte[]
- HBase可以用来存储非常大的表,上亿行的数据、有超过百万列,而且它常用在实时数据处理中。因为它的读写是很快的。
HBase的应用场景
- 只要有海量数据存储,而且需要快速的写入以及快速的读取场景,就很适合HBase
- 但要记住NoSQL的特点:对事务的支持性较弱的
- 可以用来存储爬虫的数据、点赞/转发、银行转账订单....
Hbase对于RDBMS(关系数据库管理系统)对比Hive
- RDBMS是关系型数据库支持join、ACID、有schema(创建表的时候必须要指定有哪些列、列是什么类型)...、支持二级索引
- HBase不支持join的、也不支持ACID、对事务支持有限,无schema(创建表的时候,无需去指定列、列类型)、原生就支持分布式存储的,所以可以用来存储海量数据,同时也兼顾了快速查询、写入的功能
对比Hive:
- Hive主要用于OLAP,HBase主要用于OLTP,HBase是可以直接接入到业务系统的