上一页 1 ··· 3 4 5 6 7 8 9 下一页
摘要: 在《基于Flume的美团日志收集系统(一)架构和设计》中,我们详述了基于Flume的美团日志收集系统的架构设计,以及为什么做这样的设计。在本节中,我们将会讲述在实际部署和使用过程中遇到的问题,对Flume的功能改进和对系统做的优化。1 Flume的问题总结在Flume的使用过程中,遇到的主要问题如下... 阅读全文
posted @ 2016-01-11 17:15 吉日木图 阅读(384) 评论(0) 推荐(0) 编辑
摘要: 美团的日志收集系统负责美团的所有业务日志的收集,并分别给Hadoop平台提供离线数据和Storm平台提供实时数据流。美团的日志收集系统基于Flume设计和搭建而成。《基于Flume的美团日志收集系统》将分两部分给读者呈现美团日志收集系统的架构设计和实战经验。第一部分架构和设计,将主要着眼于日志收集系... 阅读全文
posted @ 2016-01-11 17:12 吉日木图 阅读(422) 评论(0) 推荐(0) 编辑
摘要: 1剖析MapReduce作业运行机制1.1作业的提交客户端通过JobClient.runJob()来提交一个作业到jobtracker,JobClient程序逻辑如下:a)向Jobtracker请求一个新的jobid(JobTracker.getNewJobId());b)检查作业的输出说明,如已存... 阅读全文
posted @ 2015-12-14 17:12 吉日木图 阅读(269) 评论(0) 推荐(0) 编辑
摘要: MapOutputBuffer顾名思义就是Map输出结果的一个Buffer,用户在编写map方法的时候有一个参数OutputCollector:1 void map(K1 key, V1 value, OutputCollector output, Reporter reporter) throw... 阅读全文
posted @ 2015-06-05 08:31 吉日木图 阅读(536) 评论(0) 推荐(0) 编辑
摘要: gitlab多人协同工作本文为亨利向《Git权威指南》的作者蒋鑫老师的答疑邮件写成。这里特别感谢蒋鑫老师对我询问gitlab的协同工作流程问题的详细解答。蒋鑫老师的细致专业的解答让我非常感动。gitlab----新颖的git服务器托管网站,开源免费。你可以在自己的公司或者开发团队搭建好一个。gitl... 阅读全文
posted @ 2015-05-15 10:39 吉日木图 阅读(229) 评论(0) 推荐(0) 编辑
摘要: 今天想linux下安装java,然后就使用wget来下载jdk1.7,结果老是报错,大概意思是cookie有问题。如下图:然后网上看了一下,下面的地址可以下载:wget --no-cookies --no-check-certificate --header "Cookie:gpw_e24=http... 阅读全文
posted @ 2015-04-24 10:21 吉日木图 阅读(860) 评论(0) 推荐(0) 编辑
摘要: 背景随着集群规模和负载增加,MapReduce JobTracker在内存消耗,线程模型和扩展性/可靠性/性能方面暴露出了缺点,为此需要对它进行大整修。需求当我们对Hadoop MapReduce框架进行改进时,需要时刻谨记的一个重要原则是用户的需求。近几年来,从Hadoop用户那里总结出MapRe... 阅读全文
posted @ 2015-03-20 16:28 吉日木图 阅读(162) 评论(0) 推荐(0) 编辑
摘要: YARN/MRv2是下一代MapReduce框架(见Hadoop-0.23.0),该框架完全不同于当前的MapReduce框架,它在扩展性,容错性和通用性等方面更出色,据统计,Yarn有超过150000行代码,完全是重写编写的。本文介绍了YARN/MRv2中基本术语的含义,帮助有兴趣的程序员们对YA... 阅读全文
posted @ 2015-03-20 16:22 吉日木图 阅读(229) 评论(0) 推荐(0) 编辑
摘要: InputFormat 负责处理MR的输入部分。有三个作用:一、验证作业的输入是否规范.二、把输入文件切分成InputSplit.三、提供RecordReader 的实现类,把InputSplit读到Mapper中进行处理.◆ 在执行mapreduce之前,原始数据被分割成若干split,每个spl... 阅读全文
posted @ 2014-11-19 14:28 吉日木图 阅读(543) 评论(0) 推荐(0) 编辑
摘要: 关于使用java api上传文件。 在定义一个FileSystem变量的时候伪分布式和单机版的方法是不一样的,单机版使用的是FileSystem类的静态函数FileSystem hdfs = FileSystem.get(conf)伪分布式下需要使用Path来获得Path dstDir = new ... 阅读全文
posted @ 2014-11-18 19:09 吉日木图 阅读(255) 评论(0) 推荐(0) 编辑
上一页 1 ··· 3 4 5 6 7 8 9 下一页