假期学习总结二
一、HDFS的相关概念
1.块:整个HDFS当中最核心的概念
2.两大组件
名称节点:整个HDFS集群的管家(数据目录)
数据节点:存储实际数据
二、HDFS体系结构、存储原理、数据读写过程
1.体系结构
2.存储原理
冗余数据保存的问题
·加快数据传输速度
·很容易检查数据错误
·保证数据可靠性
数据冗余策略问题
数据恢复的问题
3.读取数据
4.写数据
三、HDFS编程实践
一、HBase的概念简介
1.概念
分布式数据库:可以用来存储非常结构化和半结构化的松散数据
2.元素
行键、列族、列限定符、单元格、时间戳
1.HBase功能组件
·库函数:一般用于链接每个客户端
·Master服务器:充当每个管家的作用
1.充分信息进行维护和管理
2.维护了一个Region服务器列表
3.整个集群当中有哪些Region服务器在工作
4.负责对Region进行分配
5.负载平衡
·Region服务器:负责存储不同的Region
·负责维护和管理
Master(主服务器)
1.对表进行增删改查
2.负责不同Region服务器的负载均衡
3.负责调整分裂、合并后Region的分布
4.负责重新分配故障、失效的Region服务器也要借助于Master来进行重新分配
1.创建表(名称为TempTable,包含3个列族f1,f2和f3)
2.添加数据:一次只能为一个表的一行数据里的一个列添加数据
put命令->表,行,列->指定单元格,添加数据
3.查看数据:get命令,通过表名、行、列、时间戳
4.删除数据:首先必须要让这个表失效