2017 年 7月随笔档案 - 亲爱的不二999

flume高级组件及各种报错

摘要：1，one source two channel 创建conf文件，内容如下： 2，启动HDFS 3，启动flume 4, 报错1：问题原因：缺少依赖包，这个依赖包是以下jar文件解决办法：报错2：问题原因：缺少依赖包解决办法：报错3：问题原因：缺少依赖包解决办法：报错4：问题原阅读全文

posted @ 2017-07-27 21:50 亲爱的不二999 阅读(652) 评论(0) 推荐(0) 编辑

Flume的安装，配置及使用

摘要：1，上传jar包 2，解压 3，改名 4，更改配置文件将template文件重镜像在flume-env.sh文件中更改JAVA_HOME地址：检查Flume是否安装成功成功 4，使用 flume的特点： flume是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统。支持在日志系统阅读全文

posted @ 2017-07-25 14:56 亲爱的不二999 阅读(595) 评论(0) 推荐(0) 编辑

Ubuntu及windows下kafka集群环境搭建及测试

摘要：kafka介绍： Kafka[1是一种高吞吐量[2] 的分布式发布订阅消息系统，有如下特性：通过O(1)的磁盘数据结构提供消息的持久化，这种结构对于即使数以TB的消息存储也能够保持长时间的稳定性能。高吞吐量[2] ：即使是非常普通的硬件Kafka也可以支持每秒数百万[2] 的消息。支持通过Ka 阅读全文

posted @ 2017-07-12 18:37 亲爱的不二999 阅读(1058) 评论(0) 推荐(0) 编辑

hadoop之shuffle详解

摘要：Shuffle描述着数据从map task输出到reduce task输入的这段过程。如map 端的细节图，Shuffle在reduce端的过程也能用图上标明的三点来概括。当前reduce copy数据的前提是它要从JobTracker获得有哪些map task已执行结束，这段过程不表，有兴趣的朋阅读全文

posted @ 2017-07-06 18:19 亲爱的不二999 阅读(796) 评论(0) 推荐(0) 编辑

java三

摘要：1，深复制与浅复制浅复制：被复制对象的所有变量都含有与原来的对象相同的值，而所有的对其他对象的引用仍然指向原来的对象。换言之，浅复制仅仅复制所考虑的对象，而不复制它所引用的对象。深复制：被复制对象的所有变量都含有与原来的对象相同的值，除去那些引用其他对象的变量。那些引用其他对象的变量将指向被复制阅读全文

posted @ 2017-07-06 10:15 亲爱的不二999 阅读(201) 评论(0) 推荐(0) 编辑

Hadoop之计数器与自定义计数器及Combiner的使用

摘要：1，计数器：显示的计数器中分为四个组，分别为：File Output Format Counters、FileSystemCounters、File Input Format Counters和Map-Reduce Framkework。分组File Input Format Counters包阅读全文

posted @ 2017-07-05 17:16 亲爱的不二999 阅读(654) 评论(0) 推荐(0) 编辑

Hadoop之yarn调用机制

摘要：1，Mapper方法：如果在map方法之前执行一些程序用setup，之后用cleanup.同理在Reducer方法中也有setup和cleanup。 2，map任务是并行执行，没有谁先谁后，如果是两个job，则只能覆盖setup方法。 3，有几个block就有几个map任务。 4，当block的大小阅读全文

posted @ 2017-07-05 10:52 亲爱的不二999 阅读(342) 评论(0) 推荐(0) 编辑

亲爱的不二999

07 2017 档案

公告

搜索

常用链接

最新随笔

我的标签

积分与排名

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论