2018 年 8月 23 日随笔档案 - 裸睡的猪

2018年8月23日

摘要：在执行一个Job的时候，Hadoop会将输入数据划分成N个Split，然后启动相应的N个Map程序来分别处理它们。数据如何划分？Split如何调度（如何决定处理Split的Map程序应该运行在哪台TaskTracker机器上）？划分后的数据又如何读取？这就是本文所要讨论的问题。先从一张经典的MapR 阅读全文

posted @ 2018-08-23 11:08 裸睡的猪阅读(293) 评论(0) 推荐(0) 编辑

Hadoop2.0 Namenode HA实现方案

摘要： Hadoop2.0 Namenode HA实现方案介绍及汇总 Hadoop2.0 Namenode HA实现方案介绍及汇总 Hadoop2.0 Namenode HA实现方案介绍及汇总 Hadoop2.0 Namenode HA实现方案介绍及汇总基于社区最新release的Hadoop2.2.0版阅读全文

posted @ 2018-08-23 10:28 裸睡的猪阅读(368) 评论(0) 推荐(0) 编辑

单点故障和脑裂

摘要： Hadoop中NameNode单点故障解决方案 Hadoop 1.0内核主要由两个分支组成：MapReduce和HDFS,这两个系统的设计缺陷是单点故障，即MR的JobTracker和HDFS的NameNode两个核心服务均存在单点问题，这里只讨论HDFS的NameNode单点故障的解决方案。需求阅读全文

posted @ 2018-08-23 10:26 裸睡的猪阅读(465) 评论(0) 推荐(0) 编辑

Client将数据读写HDFS流程

摘要： HDFS介绍 HDFS（Hadoop Distributed File System ）Hadoop分布式文件系统。是根据google发表的论文翻版的。什么是分布式文件系统分布式文件系统（Distributed File System）是指文件系统管理的物理存储资源不一定直接连接在本地节点上，而阅读全文

posted @ 2018-08-23 10:22 裸睡的猪阅读(638) 评论(0) 推荐(0) 编辑

Zookeeper的作用，在Hadoop及hbase中具体作用

摘要：什么是Zookeeper，Zookeeper的作用是什么，在Hadoop及hbase中具体作用是什么一、什么是Zookeeper ZooKeeper 顾名思义动物园管理员，他是拿来管大象(Hadoop) 、蜜蜂(Hive) 、小猪(Pig) 的管理员， Apache Hbase和 Apach 阅读全文

posted @ 2018-08-23 09:21 裸睡的猪阅读(2033) 评论(0) 推荐(0) 编辑