07 2015 档案

分布式消息队列kafka系列介绍 — 核心API介绍及实例
摘要:原文地址:http://www.inter12.org/archives/834 一 PRODUCER的API 1.Producer的创建,依赖于ProducerConfig public Producer(ProducerConfig config); 2.单个或是批量的消息发送 public v 阅读全文

posted @ 2015-07-21 10:55 XIAO的博客 阅读(1131) 评论(0) 推荐(0) 编辑

将文件从一台linux机器拷贝到多台的方法
摘要:首先你所操作的各台linux机器间必须设置了ssh免密码登录,具体方法可上网查看。将文件从一台linux机器拷贝到多台分为以下几个步骤: 第一步:创建脚本文件remotecopy.sh 第二步:创建主机列表文件hosts 第三步:在传输文件所在节点上运行脚本命令 阅读全文

posted @ 2015-07-17 10:57 XIAO的博客 阅读(2457) 评论(0) 推荐(0) 编辑

Flume NG之Interceptor简介
摘要:转载地址:http://www.cnblogs.com/lxf20061900/p/3658172.html 有的时候希望通过Flume将读取的文件再细分存储,比如讲source的数据按照业务类型分开存储,具体一点比如类似:将source中web、wap、media等的内容分开存储;比如丢弃或修改一 阅读全文

posted @ 2015-07-01 16:43 XIAO的博客 阅读(575) 评论(0) 推荐(0) 编辑

Flume NG 简介及配置实战
摘要:Flume 作为 cloudera 开发的实时日志收集系统,受到了业界的认可与广泛应用。Flume 初始的发行版本目前被统称为 Flume OG(original generation),属于 cloudera。但随着 FLume 功能的扩展,Flume OG 代码工程臃肿、核心组件设计不合理、核心 阅读全文

posted @ 2015-07-01 15:25 XIAO的博客 阅读(1454) 评论(0) 推荐(0) 编辑

本地日志数据实时接入到hadoop集群的数据接入方案
摘要:1.概述本手册主要介绍了,一个将传统数据接入到Hadoop集群的数据接入方案和实施方法。供数据接入和集群运维人员参考。1.1.整体方案Flume作为日志收集工具,监控一个文件目录或者一个文件,当有新数据加入时,收集新数据发送给Kafka。Kafka用来做数据缓存和消息订阅。Kafka里面的消息可以定... 阅读全文

posted @ 2015-07-01 14:27 XIAO的博客 阅读(1428) 评论(0) 推荐(1) 编辑

导航

统计

点击右上角即可分享
微信分享提示