摘要: 1:Azkaban概述 Azkaban是一个分布式工作流管理器,在LinkedIn上实现,以解决Hadoop作业依赖性问题。我们有需要按顺序运行的工作,从ETL工作到数据分析产品。 2:为什么需要工作流调度系统 1)一个完整的数据分析系统通常都是由大量任务单元组成: shell 脚本程序,java 阅读全文
posted @ 2019-05-28 09:56 大魔王阿黎 阅读(483) 评论(0) 推荐(0) 编辑