hadoop - 随笔分类 - liurio

MR1和MR2的工作原理

摘要：MapReduce1 分为6个步骤： 1、作业的提交 1)、客户端向jobtracker请求一个新的作业ID(通过JobTracker的getNewJobId()方法获取，见第2步 2)、计算作业的输入分片，将运行作业所需要的资源(包括jar文件、配置文件和计算得到的输入分片)复制到一个以ID命名的阅读全文

posted @ 2017-04-23 19:45 liurio 阅读(2367) 评论(2) 推荐(0) 编辑

MapReduce深度分析(二)

摘要：MapReduce深度分析(二) 五、JobTracker分析 JobTracker是hadoop的重要的后台守护进程之一，主要的功能是管理任务调度、管理TaskTracker、监控作业执行、运行作业容错机制等。首先启动interTrackerServer，将端口配置为mapred.job.tra 阅读全文

posted @ 2016-04-21 15:32 liurio 阅读(326) 评论(0) 推荐(0) 编辑

MapReduce深度分析(一)

摘要：MapReduce深度分析(一) 一、数据流向分析图为MapReduce数据流向示意图步骤1、输入文件从HDFS流向到Mapper节点。在一般情况下，存储数据的节点就是Mapper运行的节点，不需要在节点之间进行数据传输，也就是尽量让存储靠近计算。步骤2、mapper输出到内存缓冲区。Mapp 阅读全文

posted @ 2016-04-21 15:30 liurio 阅读(426) 评论(0) 推荐(0) 编辑

MapReduce计算框架

摘要：MapReduce计算框架一、MapReduce实现原理图展示了MapReduce实现中的全部流程，处理步骤如下： 1、用户程序中的MapReduce函数库首先把输入文件分成M块(每块大小默认64M)，在集群上执行处理程序，见序号1 2、主控程序master分配Map任务和Reduce任务给工作阅读全文

posted @ 2016-04-18 17:08 liurio 阅读(2695) 评论(0) 推荐(0) 编辑

HDFS存储系统

摘要：HDFS存储系统一、基本概念 1、NameNode HDFS采用Master/Slave架构。namenode就是HDFS的Master架构。主要负责HDFS文件系统的管理工作，具体包括：名称空间(namespace)管理(如打开、关闭、重命名文件和目录、映射关系)、文件block管理。NameN 阅读全文

posted @ 2016-04-13 16:51 liurio 阅读(1755) 评论(0) 推荐(0) 编辑

hadoop-1.x的运行实例

摘要：我的环境是hadoop-0.20.2,eclipse：SDK-3.3.2,源数据为：Apr 23 11:49:54 hostapd: wlan0: STA 14:7d:c5:9e:fb:84Apr 23 11:49:54 hostapd: wlan0: STA 14:7d:c5:9e:fb:84Ap... 阅读全文

posted @ 2016-01-23 22:00 liurio 阅读(338) 评论(0) 推荐(0) 编辑

hadoop学习笔记--集群搭建

摘要：注：大家常说的ssh其实就是一个免密码访问的东西，为了简化操作的，不用每次访问其他节点重新输入密码。但是要想配置如下：1.在每台机器上执行 ssh-keygen -t rsa，连敲三次回车键(即设置空密码)2.然后在每台机器上都执行cd ~/.ssh，并分别把id_rsa.pub复制到authori... 阅读全文

posted @ 2016-01-22 22:39 liurio 阅读(403) 评论(0) 推荐(0) 编辑

随笔分类 - hadoop

公告