11月总结1

一、HDFS的相关概念

  1.块:整个HDFS当中最核心的概念

  2.两大组件

    名称节点:整个HDFS集群的管家(数据目录)

    数据节点:存储实际数据

 

二、HDFS体系结构、存储原理、数据读写过程

  1.体系结构

  2.存储原理

    冗余数据保存的问题

    ·加快数据传输速度

    ·很容易检查数据错误

    ·保证数据可靠性

    数据冗余策略问题

    数据恢复的问题

  3.读取数据

   4.写数据

三、HDFS编程实践

 

 

一、HBase的概念简介

1.概念

  分布式数据库:可以用来存储非常结构化和半结构化的松散数据

2.元素

  行键、列族、列限定符、单元格、时间戳

1.HBase功能组件

  ·库函数:一般用于链接每个客户端

  ·Master服务器:充当每个管家的作用

    1.充分信息进行维护和管理

    2.维护了一个Region服务器列表

    3.整个集群当中有哪些Region服务器在工作

    4.负责对Region进行分配

    5.负载平衡

  ·Region服务器:负责存储不同的Region

    ·负责维护和管理

 Master(主服务器)

    1.对表进行增删改查

    2.负责不同Region服务器的负载均衡

    3.负责调整分裂、合并后Region的分布

    4.负责重新分配故障、失效的Region服务器也要借助于Master来进行重新分配

1.创建表(名称为TempTable,包含3个列族f1,f2和f3)

 2.添加数据:一次只能为一个表的一行数据里的一个列添加数据

put命令->表,行,列->指定单元格,添加数据

 3.查看数据:get命令,通过表名、行、列、时间戳

 

 4.删除数据:首先必须要让这个表失效

posted @ 2020-11-07 10:30  wwbzuiku  阅读(68)  评论(0编辑  收藏  举报