摘要: .hadoop是什么 Hadoop被公认是一套行业大数据标准开源软件,在分布式环境下提供了海量数据的处理能力。几乎所有主流厂商都围绕Hadoop开发工具、开源软件、商业化工具和技术服务。今年大型IT公司,如EMC、Microsoft、Intel、Teradata、Cisco都明显增加了Hadoop方 阅读全文
posted @ 2019-09-27 20:53 程序员_新时代纳妾 阅读(192) 评论(0) 推荐(0) 编辑
摘要: 1. Azkaban Web Server 的配置 (1) 基本配置 配置 说明 默认值 azkaban.name 网页上显示的Azkaban实例的名称 Local azkaban.label Azkaban实例的描述信息 My Local Azkaban azkaban.color 网页的主题颜色 阅读全文
posted @ 2019-09-27 08:26 程序员_新时代纳妾 阅读(1771) 评论(0) 推荐(0) 编辑
摘要: flume 拦截器(interceptor)1、flume拦截器介绍拦截器是简单的插件式组件,设置在source和channel之间。source接收到的事件event,在写入channel之前,拦截器都可以进行转换或者删除这些事件。每个拦截器只处理同一个source接收到的事件。可以自定义拦截器。 阅读全文
posted @ 2019-09-25 19:49 程序员_新时代纳妾 阅读(244) 评论(0) 推荐(0) 编辑
摘要: 一、 Apache Flume. 1. 概述... 2. 运行机制... 3. Flume采集系统结构图... 3.1. 简单结构... 3.2. 复杂结构... 二、 Flume安装部署... 三、 Flume简单案例... 1. 采集目录到HDFS. 2. 采集文件到HDFS. 四、 Flume 阅读全文
posted @ 2019-09-25 09:40 程序员_新时代纳妾 阅读(417) 评论(0) 推荐(0) 编辑