摘要:
DataX3.0快速入门 一、DataX3.0概览 DataX是阿里云DataWorks数据集成的开源版本,在阿里巴巴集团内部被广泛使用的离线数据同步工具/平台。解决了数据库之中的数据同步、迁移问题,把网状结构转为星型结构,主要用于数据库之间传送业务数据。 为了解决异构数据源同步问题,DataX将复 阅读全文
摘要:
Flume快速入门 一、简介 高可用、高可靠,分布式的海量日志采集、聚合和传输系统,基于流式架构,灵活简单。 event:事件 source:数据源 sink:目标 channel:数据管道 通过获取数据源转化为事件进入数据管道,在数据管道通过中流向目标对象(HDFS、HBase、MySQL等)进行 阅读全文