HBase入门（1）

小伙伴们大家好～

HBase 是BigTable的开源 java 版本。数据文件存储在 HDFS，是一个分布式、可扩展、支持海量数据存储的NoSQL 的数据库
具有高可靠性、高性能、可扩展、列存储、实时读写等特点
HBase 仅能通过主键(row key)和主键的 range 来检索数据，仅支持单行事务
主要用来存储结构化和半结构化的松散数据
Hbase 查询数据功能很简单，不支持 join 等复杂操作，不支持复杂的事务（行级的事务），从技术上来说，HBase 更像是一个「数据存储」而不是「数据库」，因为 HBase 缺少 RDBMS 中的许多特性，例如带类型的列、二级索引以及高级查询语言等
Hbase 中支持的数据类型：byte[]
与 Hadoop 一样，Hbase 目标主要依靠横向扩展，通过不断增加廉价的商用服务器，来增加存储和处理能力，例如，把集群从 10 个节点扩展到 20 个节点，存储能力和处理能力都会加倍
HBase 中的表一般有这样的特点
- 大：一个表可以有上十亿行，上百万列
- 面向列：面向列(族)的存储和权限控制，列(族)独立检索
- 稀疏：对于为空(null)的列，并不占用存储空间，因此，表可以设计的非常稀疏

我的公众号：主要记录大数据+金融的学习笔记

欢迎关注：

posted @ 2022-01-06 12:02 flashman126 阅读(77) 评论(0) 收藏举报

刷新页面返回顶部

七月的风