2014年11月24日

Hadoop MapReduceV2(Yarn) 框架简介

摘要: http://www.ibm.com/developerworks/cn/opensource/os-cn-hadoop-yarn/对于业界的大数据存储及分布式处理系统来说,Hadoop 是耳熟能详的卓越开源分布式文件存储及处理框架,对于 Hadoop 框架的介绍在此不再累述,读者可参考Hadoop... 阅读全文

posted @ 2014-11-24 22:58 白乔 阅读(224) 评论(0) 推荐(0) 编辑

Spark技术内幕:Client,Master和Worker 通信源码解析

摘要: http://blog.csdn.net/anzhsoft/article/details/30802603Spark的Cluster Manager可以有几种部署模式:StandloneMesosYARNEC2Local在向集群提交计算任务后,系统的运算模型就是Driver Program定义的S... 阅读全文

posted @ 2014-11-24 22:56 白乔 阅读(455) 评论(0) 推荐(0) 编辑

Spark技术内幕:Stage划分及提交源码分析

摘要: http://blog.csdn.net/anzhsoft/article/details/39859463当触发一个RDD的action后,以count为例,调用关系如下:org.apache.spark.rdd.RDD#countorg.apache.spark.SparkContext#run... 阅读全文

posted @ 2014-11-24 22:55 白乔 阅读(834) 评论(0) 推荐(0) 编辑

无责任比较thrift vs protocol buffers

摘要: http://blog.csdn.net/socoolfj/article/details/3855007最新版本的Hadoop代码中已经默认了Protocol buffer作为RPC的默认实现,原来的WritableRpcEngine已经被淘汰了。来自cloudera的Aaron T. Myers... 阅读全文

posted @ 2014-11-24 22:02 白乔 阅读(393) 评论(0) 推荐(0) 编辑

理解hadoop的Map-Reduce数据流(data flow)

摘要: http://blog.csdn.net/yclzh0522/article/details/6859778Map-Reduce的处理过程主要涉及以下四个部分:客户端Client:用于提交Map-reduce任务jobJobTracker:协调整个job的运行,其为一个Java进程,其main cl... 阅读全文

posted @ 2014-11-24 21:47 白乔 阅读(201) 评论(0) 推荐(0) 编辑

hadoop-2.5安装与配置

摘要: 安装之前准备4台机器:bluejoe0,bluejoe4,bluejoe5,bluejoe9bluejoe0作为master,bluejoe4,5,9作为slavebluejoe0作为namenodebluejoe9为secondary namenodebluejoe4,5,9作为datanode安... 阅读全文

posted @ 2014-11-24 15:54 白乔 阅读(372) 评论(0) 推荐(0) 编辑

linux下查看本地程序占用的端口

摘要: netstat -apn结合ps 阅读全文

posted @ 2014-11-24 15:33 白乔 阅读(158) 评论(0) 推荐(0) 编辑

导航