Azkaban介绍
(1)Azkaban概述
Azkaban是一个批量工作流任务调度器。用于在一个工作流内以一个特定的顺序运行一组工作和流程。Azkaban定义了一种KV文件格式来建立任务之间的依赖关系,并提供一个易于使用的web用户界面维护和跟踪你的工作流。
(2)Azkaban安装部署
1、安装好以下三个服务器,azkaban-web-server-2.5.0.tar.gz是服务器,azkaban-executor-server-2.5.0.tar.gz是执行服务器,azkaban-sql-script-2.5.0.tar.gz是执行的sql脚本。
2、azkaban只支持 mysql,在mysql中创建数据库,然后运行azkaban提供的sql脚本来创建azkaban所需要的表。
3、修改相应的配置文件,启动web服务器,执行服务器。
(3)Azkaban实战
1、创建单一job工作流
1)创建job描述文件,type=?;command=?;
2)将job资源文件打包成zip文件
3)通过azkaban的web管理平台创建project并上传job压缩包
2、多job工作流flow