摘要:这周简单的了解到了zookeeper ZooKeeper是一个开源的分布式协调服务,旨在为分布式应用程序提供高性能的、可靠的协调功能。它提供了简单的原子性操作和通知机制,用于管理和协调分布式环境中的各种任务,例如领导者选举、配置管理、分布式锁、命名服务等。下面是ZooKeeper的使用方面的一些关键
阅读全文
|
07 2023 档案
摘要:这周简单的了解到了zookeeper ZooKeeper是一个开源的分布式协调服务,旨在为分布式应用程序提供高性能的、可靠的协调功能。它提供了简单的原子性操作和通知机制,用于管理和协调分布式环境中的各种任务,例如领导者选举、配置管理、分布式锁、命名服务等。下面是ZooKeeper的使用方面的一些关键
阅读全文
摘要:这周学习了hbase HBase是一个分布式的、可扩展的、面向列存储的NoSQL数据库,它构建在Hadoop之上并运行在HDFS(Hadoop分布式文件系统)之上。HBase的设计目标是提供高可靠性、高性能、高扩展性和实时读写访问能力,适用于存储和处理大规模的结构化数据。以下是HBase的使用方面的
阅读全文
摘要:这一周的学习是学习及使用hive进行数据的一些操作 Hive是一个基于Hadoop的数据仓库和查询工具,它提供了类似于SQL的查询语言和操作接口,使用户能够方便地执行数据分析和查询操作。Hive的设计目标是为那些熟悉SQL语言的用户提供一种简单、交互式的方式来处理分布式存储的大数据集。Hive的使用
阅读全文
摘要:第一周的学习主要是学习了Hadoop的安装及使用。 Hadoop是一个开源的分布式计算平台,用于处理大规模数据集的存储和分析任务。它由Apache软件基金会开发,能够处理超过普通服务器能力范围的数据量,并能够提供容错性和高可用性。Hadoop的使用包括以下主要组件和功能: 1.Hadoop Dist
阅读全文
|