HBase系列---【(一)HBase的介绍】
HBase的介绍及使用
1.HBase是什么
HBase是基于Google的BigTable论文,建立在HDFS之上,提供高可靠性,高性能,列存储,可伸缩,实时读写的分布式大数据数据库。
2.HBase的特点
- 1.极易扩展,海量存储
底层依赖HDFS,当磁盘空间不足的时候,只需要动态增加datanode节点就可以了,可以通过增加服务器来对集群的存储进行扩容。- 2.列式存储
HBase表的数据是基于列族进行存储的,列族是在列的方向上的划分。- 3.高并发
对大数据量的读写都能保证毫秒级响应- 4.稀疏
稀疏主要是针对HBase列的灵活性,在列族中,你可以指定任意多的列,在列数据为空的情况下,是不会占用存储空间的。- 5.数据的多版本
HBase表中的数据可以有多个版本值,默认情况下是根据版本号去区分,版本号就是插入数据的时间戳。- 6.数据类型单一
所有的数据在HBase中是以字节数组进行存储。
3.HBase在实际场景中的应用
- 1.交通方面
例如:船舶GPS信息,全长江的船舶GPS信息,每天有1千万左右的数据存储。- 2.金融方面
例如: 消费信息,贷款信息,信用卡还款信息等。- 3.电商方面
例如:电商网站的交易信息,物流信息,游览信息等。- 4.电信方面
通话信息,语音详单等。
总结: 海量明细数据的存储,并且后期需要有很好的查询性能。
注意:HBase和Hive的区别?
Hive适合用来对一段时间内的数据进行分析查询,例如,用来计算趋势或者网站的日志。Hive不应该用来进行实时的查询。因为它需要很长时间才可以返回结果。
Hbase非常适合用来进行大数据的实时查询,随机访问。Facebook用Hbase进行消息和实时的分析。它也可以用来统计Facebook的连接数。
愿你走出半生,归来仍是少年!
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
· AI与.NET技术实操系列(二):开始使用ML.NET
· 单线程的Redis速度为什么快?