HBase与Hive对比
Hive
- 数据仓库
Hive的本质其实就相当于HDFS中已经存储的文件在MySql中做了一个双射关系,以方便使用HQL去管理查询。
- 用于数据分析、清洗
Hive适用于离线的数据分析和清洗,延迟较高。
- 基于HDFS、MapReduce
Hive存储的数据依旧在DataNode上,编写的HQL语句终将是转换为MapReduce代码执行。
HBase
- 数据库
是一种面向列族的非关系型数据库。
- 用于存储结构化和非结构化的数据
适用于单列表非关系型数据的存储,不适合做关联查询,类似Jion等操作。
- 基于HDFS
数据持久化存储的体现形式是HFile,存放于DataNode中,被ResionServer以region的形式进行管理。
- 延迟较低,接入在线业务使用
面对大量的企业数据,HBase可以直接单表大量数据的存储,同时提供高效的数据访问速度。
作者:Jace Jin
github地址:https://github.com/buxianghua
原创文章版权归作者所有.
欢迎转载,转载时请在文章页面明显位置给出原文连接,否则保留追究法律责任的权利.
欢迎转载,转载时请在文章页面明显位置给出原文连接,否则保留追究法律责任的权利.
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· Docker 太简单,K8s 太复杂?w7panel 让容器管理更轻松!