2018年8月6日

经典的MapReduce1中的失败

摘要: 经典的MapReduce1中的失败在MapReduce1运行时,主要考虑三种失败的模式,运行任务失败、tasktracker失败以及jobtracker失败1. 任务运行失败首先考虑子任务失败的情况。最常见的情况是map任务或reduce任务中的用户代码抛出运行异常。如果发生这种情况,子任务JVM进 阅读全文

posted @ 2018-08-06 21:23 嘣嘣嚓 阅读(416) 评论(0) 推荐(0) 编辑

HBase协处理器的使用(添加Solr二级索引)

摘要: 给HBase添加一二级索引,HBase协处理器结合solr 代码如下 Solr代码处理如下 协处理器使用步骤如下 1.代码打jar包,并上传至HDFS 2.创建HBase表并添加协处理器,如下 3.测试 此时,可通过HBase日志查看协处理器的处理情况。 没错误的情况下,Solr中应该已经也有数据了 阅读全文

posted @ 2018-08-06 16:49 嘣嘣嚓 阅读(947) 评论(0) 推荐(0) 编辑

Flume具体应用(多案例)

摘要: 日志采集 对于flume的原理其实很容易理解,我们更应该掌握flume的具体使用方法,flume提供了大量内置的Source、Channel和Sink类型。而且不同类型的Source、Channel和Sink可以自由组合—–组合方式基于用户设置的配置文件,非常灵活。比如:Channel可以把事件暂存 阅读全文

posted @ 2018-08-06 15:06 嘣嘣嚓 阅读(522) 评论(0) 推荐(0) 编辑

Flume架构及运行机制

摘要: flume 作为 cloudera 开发的实时日志收集系统,受到了业界的认可与广泛应用。Flume 初始的发行版本目前被统称为 Flume OG(original generation),属于 cloudera。但随着 FLume 功能的扩展,Flume OG 代码工程臃肿、核心组件设计不合理、核心 阅读全文

posted @ 2018-08-06 14:42 嘣嘣嚓 阅读(690) 评论(0) 推荐(0) 编辑

导航