摘要: Zookeeper为分布式环境提供灵活的协调基础架构。ZooKeeper框架支持许多当今最好的工业应用程序。我们将在本章中讨论ZooKeeper的一些最显着的应用。 雅虎 ZooKeeper框架最初是在“Yahoo!”中构建的。设计良好的分布式应用程序需要满足诸如数据透明度,更好的性能,稳健性,集中 阅读全文
posted @ 2018-09-01 14:49 borter 阅读(170) 评论(0) 推荐(0) 编辑
摘要: ZooKeeper有一个绑定Java和C的官方API。Zookeeper社区为大多数语言(.NET,python等)提供非官方API。使用ZooKeeper API,应用程序可以连接,交互,操作数据,协调,最后断开与ZooKeeper集合的连接。 ZooKeeper API具有丰富的功能,以简单和安 阅读全文
posted @ 2018-09-01 14:48 borter 阅读(225) 评论(0) 推荐(0) 编辑
摘要: ZooKeeper命令行界面(CLI)用于与ZooKeeper集合进行交互以进行开发。它有助于调试和解决不同的选项。 要执行ZooKeeper CLI操作,首先打开ZooKeeper服务器(“bin/zkServer.sh start”),然后打开ZooKeeper客户端(“bin/zkCli.sh 阅读全文
posted @ 2018-09-01 14:47 borter 阅读(139) 评论(0) 推荐(0) 编辑
摘要: 让我们分析如何在ZooKeeper集合中选举leader节点。考虑一个集群中有N个节点。leader选举的过程如下: 所有节点创建具有相同路径 /app/leader_election/guid_ 的顺序、临时节点。 ZooKeeper集合将附加10位序列号到路径,创建的znode将是 /app/l 阅读全文
posted @ 2018-09-01 14:46 borter 阅读(117) 评论(0) 推荐(0) 编辑
摘要: 在安装ZooKeeper之前,请确保你的系统是在以下任一操作系统上运行: 任意Linux OS - 支持开发和部署。适合演示应用程序。 Windows OS - 仅支持开发。 Mac OS - 仅支持开发。 任意Linux OS - 支持开发和部署。适合演示应用程序。 Windows OS - 仅支 阅读全文
posted @ 2018-09-01 14:46 borter 阅读(417) 评论(0) 推荐(0) 编辑
摘要: 一旦ZooKeeper集合启动,它将等待客户端连接。客户端将连接到ZooKeeper集合中的一个节点。它可以是leader或follower节点。一旦客户端被连接,节点将向特定客户端分配会话ID并向该客户端发送确认。如果客户端没有收到确认,它将尝试连接ZooKeeper集合中的另一个节点。 一旦连接 阅读全文
posted @ 2018-09-01 14:45 borter 阅读(254) 评论(0) 推荐(0) 编辑
摘要: ZooKeeper的架构 看看下面的图表。它描述了ZooKeeper的“客户端-服务器架构”。 作为ZooKeeper架构的一部分的每个组件在下表中进行了说明。 客户端,我们的分布式应用集群中的一个节点,从服务器访问信息。对于特定的时间间隔,每个客户端向服务器发送消息以使服务器知道客户端是活跃的。 阅读全文
posted @ 2018-09-01 14:44 borter 阅读(661) 评论(0) 推荐(0) 编辑
摘要: 在深入了解ZooKeeper的运作之前,让我们来看看ZooKeeper的基本概念。我们将在本章中讨论以下主题:1、Architecture(架构)2、Hierarchical namespace(层次命名空间)3、Session(会话)4、Watches(监视) 阅读全文
posted @ 2018-09-01 14:43 borter 阅读(105) 评论(0) 推荐(0) 编辑
摘要: 分布式应用可以在给定时间(同时)在网络中的多个系统上运行,通过协调它们以快速有效的方式完成特定任务。通常来说,对于复杂而耗时的任务,非分布式应用(运行在单个系统中)需要几个小时才能完成,而分布式应用通过使用所有系统涉及的计算能力可以在几分钟内完成。 通过将分布式应用配置为在更多系统上运行,可以进一步 阅读全文
posted @ 2018-09-01 14:42 borter 阅读(654) 评论(0) 推荐(0) 编辑
摘要: Apache ZooKeeper是由集群(节点组)使用的一种服务,用于在自身之间协调,并通过稳健的同步技术维护共享数据。ZooKeeper本身是一个分布式应用程序,为写入分布式应用程序提供服务。 ZooKeeper提供的常见服务如下 : 命名服务 - 按名称标识集群中的节点。它类似于DNS,但仅对于 阅读全文
posted @ 2018-09-01 14:42 borter 阅读(352) 评论(0) 推荐(0) 编辑
摘要: ZooKeeper是一种分布式协调服务,用于管理大型主机。在分布式环境中协调和管理服务是一个复杂的过程。ZooKeeper通过其简单的架构和API解决了这个问题。ZooKeeper允许开发人员专注于核心应用程序逻辑,而不必担心应用程序的分布式特性。 ZooKeeper框架最初是在“Yahoo!"上构 阅读全文
posted @ 2018-09-01 14:41 borter 阅读(99) 评论(0) 推荐(0) 编辑
摘要: 通过Hadoop安全部署经验总结,开发出以下十大建议,以确保大型和复杂多样环境下的数据信息安全。 1、先下手为强!在规划部署阶段就确定数据的隐私保护策略,最好是在将数据放入到Hadoop之前就确定好保护策略。 2、确定哪些数据属于企业的敏感数据。根据公司的隐私保护政策,以及相关的行业法规和政府规章来 阅读全文
posted @ 2018-09-01 14:37 borter 阅读(808) 评论(0) 推荐(0) 编辑
摘要: Hadoop是原Yahoo的Doug Cutting根据Google发布的学术论文研究而来。Doug Cutting给这个Project起了个名字,就叫Hadoop。 Doug Cutting在Cloudera公司任职。Cloudera的Hadoop是商用版。不同于Apache的开源版。 如果要研究 阅读全文
posted @ 2018-09-01 14:36 borter 阅读(488) 评论(0) 推荐(0) 编辑
摘要: Cloudera Cloudera Cloudera公司主要提供Apache Hadoop开发工程师认证(Cloudera CertifiedDeveloper for Apache Hadoop ,CCDH)和Apache Hadoop管理工程师认证(Cloudera CertifiedAdmin 阅读全文
posted @ 2018-09-01 14:36 borter 阅读(1618) 评论(0) 推荐(0) 编辑
摘要: Hadoop Common: 在0.20及以前的版本中,包含HDFS、MapReduce和其他项目公共内容,从0.21开始HDFS和MapReduce被分离为独立的子项目,其余内容为Hadoop Common HDFS: Hadoop分布式文件系统(Distributed File System) 阅读全文
posted @ 2018-09-01 14:33 borter 阅读(624) 评论(0) 推荐(0) 编辑
摘要: MapReduce 最简单的 MapReduce应用程序至少包含 3 个部分:一个 Map 函数、一个 Reduce 函数和一个 main 函数。main 函数将作业控制和文件输入/输出结合起来。在这点上,Hadoop 提供了大量的接口和抽象类,从而为 Hadoop应用程序开发人员提供许多工具,可用 阅读全文
posted @ 2018-09-01 14:32 borter 阅读(867) 评论(0) 推荐(0) 编辑
摘要: MapReduce与Hadoop之比较 Hadoop是Apache软件基金会发起的一个项目,在大数据分析以及非结构化数据蔓延的背景下,Hadoop受到了前所未有的关注。 Hadoop是一种分布式数据和计算的框架。它很擅长存储大量的半结构化的数据集。数据可以随机存放,所以一个磁盘的失败并不会带来数据丢 阅读全文
posted @ 2018-09-01 14:31 borter 阅读(1066) 评论(0) 推荐(0) 编辑
摘要: HBase和ZooKeeper HBase内置有ZooKeeper,也可以使用外部ZooKeeper。 让HBase使用一个已有的不被HBase托管的Zookeep集群,需要设置 conf/hbase env sh文件中的HBASE_MANAGES_ZK 属性为 false ... # Tell H 阅读全文
posted @ 2018-09-01 14:30 borter 阅读(594) 评论(0) 推荐(0) 编辑
摘要: 在Zookeeper中,znode是一个跟Unix文件系统路径相似的节点,可以往这个节点存储或获取数据。如果在创建znode时Flag设置为EPHEMERAL,那么当创建这个znode的节点和Zookeeper失去连接后,这个znode将不再存在在Zookeeper里,Zookeeper使用Watc 阅读全文
posted @ 2018-09-01 14:29 borter 阅读(423) 评论(0) 推荐(0) 编辑
摘要: ZooKeeper是以Fast Paxos算法为基础的,Paxos 算法存在活锁的问题,即当有多个proposer交错提交时,有可能互相排斥导致没有一个proposer能提交成功,而Fast Paxos作了一些优化,通过选举产生一个leader (领导者),只有leader才能提交proposer, 阅读全文
posted @ 2018-09-01 14:28 borter 阅读(1241) 评论(0) 推荐(0) 编辑