随笔分类 -  azkaban、sqoop、flume

摘要:第一节:简介 一、概念 flume是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统。支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接受方(比如文本、HDFS、Hbase等)的能力 。 做数据收集的工具,主要用于日志文件的收集。是一 阅读全文
posted @ 2019-06-30 17:27 快乐的张小凡 阅读(197) 评论(0) 推荐(0) 编辑
摘要:第一节:简介 一、概念 Azkaban是一套简单的任务调度服务,整体包括三部分webserver、dbserver、executorserver。 Azkaban是linkin的开源项目,开发语言为Java。 Azkaban是由Linkedin开源的一个批量工作流任务调度器。用于在一个工作流内以一个 阅读全文
posted @ 2019-06-30 17:22 快乐的张小凡 阅读(432) 评论(0) 推荐(0) 编辑
摘要:导入:传统关系型数据库 >大数据平台的importmysql >hadoop--connect 指定关系型数据库链接url mysql:jdbc://hadoop02:3306/--username 指定数据库的用户名--password 指定数据库的密码--table 指定要导出数据的mysql数 阅读全文
posted @ 2019-06-09 21:54 快乐的张小凡 阅读(197) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示