暑假周进度总结(5)

本周学习了教材中的第四章:分布式数据库Hbase

通过学习本章内容学习到HBase跟传统关系数据库有很大的区别,

(1)数据类型:关系数据库都是运用了关系模型,主体-属性的方法来找出对应关系来进行存储,而HBase采用了很简单的数据模型,他将数据存储为未解释的字符串。

(2)数据操作:关系数据库有很多操作,表连接等,HBase不存在这些复杂的操作,只有增删改查。

(3)存储模式:关系数据库是通过行来进行操作,例如增加完整的一行,删除完整的一行。而HBase是通过列来进行操作,同时存储的时候HBase也是通过列来进行存储的

(4)数据索引:传统关系数据库是二维表,而HBase是四维表,关系数据库通过一个2个关键值便能索引到数据,而HBase只有一个索引---行键。

(5)数据维护:关系数据库中,更新操纵新数据会覆盖就数据,而在HBase中会保留旧数据。

(6)可伸缩性:关系数据库因为是进行行操作,一旦表建好了,增加属性就很难进行操作,而HBase是通过列操作,增加一列来进行横向扩展就变得更容易。

HBase的四个维度:行键、列族、列名、时间戳。

三个主要功能组件:1.库函数:提供客户端和HBase的端口连接访问,2.Master主服务器:负责管理和维护HBase表的分区信息,3.Region服务器:负责存储和维护分配给自己的Region,处理来自客户端的读写请求。

三层寻址原理:既能满足大量数据的地址的存储还能满足准确的定位。客户端先访问ROOT表找到存放Region的META表,通过META表来找到存放region的region地址。

posted @ 2019-08-11 21:25  HHHarden13  阅读(93)  评论(0编辑  收藏  举报