ZFYCH_Love

Simply but Powerful

  博客园 :: 首页 :: 博问 :: 闪存 :: 新随笔 :: 联系 :: 订阅 订阅 :: 管理 ::
  115 随笔 :: 1 文章 :: 36 评论 :: 18万 阅读
< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

06 2016 档案

摘要:前言: 学了几天storm的基础,发现如果有hadoop基础,再理解起概念来,容易的多。不过,涉及到一些独有的东西,如调度,如并发度,还是很麻烦。那么,从这一篇开始,力争清晰的梳理这些知识。 在正式学习并发之前,有必要先明确几个基本概念的定义,以及具体作用。 一、基础概念 1.1 Topology 阅读全文
posted @ 2016-06-24 15:09 xiaoyang_ 阅读(623) 评论(0) 推荐(1) 编辑

摘要:上一篇介绍了一个job的提交过程。期间多次提到通信协议。那么协议是什么? 协议其实就是通信的双方所遵守的一套规范,这套规范规定了通信时传输的数据的固定的格式。 4.1 RPC协议:在hadoop中,我们采用的是RPC协议。 该协议主要包含四个部分: 序列化层:协议中的参数采用Protocol Buf 阅读全文
posted @ 2016-06-16 16:36 xiaoyang_ 阅读(669) 评论(0) 推荐(0) 编辑

摘要:在MRv1中,各个模块间驱动运行的方式是函数调用的方式。这是同步的过程,上一模块调用下一模块函数后,等待其执行。效率不高。 在MRv2中做了改进,yarn基于事件驱动的并发模型。在详细介绍前,先看下图: 处理请求会作为事件进入系统,有中央异步调度器【AsyncDispatcher】传递给对应的事件调 阅读全文
posted @ 2016-06-16 16:36 xiaoyang_ 阅读(465) 评论(0) 推荐(0) 编辑

摘要:我们会定义Job,我们会定义map和reduce程序。那么,这个Job到底是怎么提交的?提交到哪去了?它到底和集群怎么进行交互的呢? 这篇文章将从头讲起。 开发hadoop的程序时,一共有三大块,也就是Driver、map、reduce,在Driver中,我们要定义Configuration,定义J 阅读全文
posted @ 2016-06-01 19:17 xiaoyang_ 阅读(6267) 评论(0) 推荐(0) 编辑

摘要:在弄清楚yarn是什么之前,先来看一下MRv1。 它的由编程模型+数据处理引擎(map/reduceTask)+运行时环境组成(JobTracker/TaskTracker)。其中JobTracker存在很多问题,如下: 1、JobTracker本身承担了调度和计算的任务,太累了 2、JobTrac 阅读全文
posted @ 2016-06-01 17:07 xiaoyang_ 阅读(508) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示