随笔分类 -  Gobblin

摘要:作者:Syn良子 出处:http://www.cnblogs.com/cssdongl 转载请注明出处 Gobblin的前身是linkedin的Camus,好多人也用过,准备用Gobblin的方式来抽取数据,不过由于连接的集群是CDH的,而Gobblin默认支持的是hadoop2.3.0,因此需要手 阅读全文
posted @ 2016-11-23 18:11 Syn良子 阅读(1600) 评论(6) 推荐(0)
摘要:作者:Syn良子 出处:http://www.cnblogs.com/cssdongl 转载请注明出处 找时间总结整理了下数据从Kafka到Hdfs的一些pipeline,如下 Confluent的Kafka Connect旨在通过标准化如何将数据移入和移出Kafka来简化构建大规模实时数据管道的过 阅读全文
posted @ 2016-11-18 13:01 Syn良子 阅读(12240) 评论(5) 推荐(2)