第三周假期报告 - 嘎嘎鸭1

公告

随笔档案

阅读排行榜

这周学习了hbase

HBase是一个分布式的、可扩展的、面向列存储的NoSQL数据库，它构建在Hadoop之上并运行在HDFS（Hadoop分布式文件系统）之上。HBase的设计目标是提供高可靠性、高性能、高扩展性和实时读写访问能力，适用于存储和处理大规模的结构化数据。
以下是HBase的使用方面的一些关键点：

1.数据模型：HBase的数据模型类似于关系数据库的表，但是它是基于列族（column family）的。数据存储在一个表中，表可以包含一个或多个列族，每个列族可以包含多个列。列族内的列是动态的，可以根据需要添加或删除。这种数据模型的结构灵活性使得HBase适用于存储稀疏、结构化数据。
2.表的创建和管理：在HBase中，用户可以使用HBase Shell或HBase API来创建和管理表。表的创建涉及设置表名、列族和表的相关配置信息。用户还可以为表添加和删除列族，设置存储策略、压缩和块缓存等表级属性。
3.数据的读写操作：通过HBase API，用户可以进行数据的读写操作。数据以行为单位存储，并使用行键（row key）进行唯一标识。用户可以根据行键进行快速的读取和写入操作。HBase提供了原子性的读写能力，并支持高并发。此外，HBase还支持范围扫描（range scan）和过滤器（filter）等高级数据访问技术。
4.数据一致性和持久性：HBase使用WAL（Write-Ahead Log）和HBase的分布式协议来保证数据的一致性和持久性。WAL用于记录数据的变更操作，以防止数据丢失。HBase通过将数据存储在HDFS上，保证了数据的持久性，即使发生节点故障，数据仍然可靠地保存。
5.数据分区和负载均衡：HBase通过使用分布式哈希表（DHT）来分区数据，并将其分散在集群中的不同节点上。这种分布式的设计可以有效地进行负载均衡，提高读写操作的性能。HBase还提供了自动的负载均衡机制，根据数据的分布情况，自动将负载均衡在集群中的节点上。
6.故障恢复和容错性：HBase具备故障恢复和容错性。当节点发生故障时，HBase会自动将数据从失效的节点上复制到其他正常的节点上，以保证数据的可靠性和一致性。HBase还支持备份和恢复机制，允许用户根据需要将数据备份到远程位置，并在需要时进行恢复。

综上所述，HBase是一个面向列存储的分布式NoSQL数据库，适用于存储和处理大规模的结构化数据。通过其灵活的数据模型、高吞吐量的读写能力、数据一致性和容错性等特性，HBase成为处理实时和可扩展数据应用程序的一种强大工具。

posted on 2023-07-22 12:44 嘎嘎鸭1 阅读(5) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· 第二周假期报告

· 第一周假期报告

· 每周总结（22/8/27）

· HBase

· HBase-day01 HBase基本概述和相关概念

阅读排行：
· 阿里最新开源QwQ-32B，效果媲美deepseek-r1满血版，部署成本又又又降低了！
· 单线程的Redis速度为什么快？
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决：字节Trae VS Cursor，谁才是开发者新宠？
· 展开说说关于C#中ORM框架的用法！

历史上的今天：
2022-07-22 Java学习第四周

qwb0614

公告

搜索

常用链接

我的标签

随笔分类

随笔档案

阅读排行榜