Airflow Dag可视化管理编辑工具Airflow Console
Airflow Console: https://github.com/Ryan-Miao/airflow-console
Apache Airflow扩展组件,
可以辅助生成dag, 并存储到git仓库.
Airflow提供了基于python语法的dag任务管理,我们可以定制任务内容
和任务依赖. 但对于很多数据分析人员来说,操作还是过于复杂. 期望可以
通过简单的页面配置去管理dag.
即本项目提供了一个dag可视化配置管理方案.
如何使用
一些概念
DAG: Airflow原生的dag, 多个任务依赖组成的有向无环图, 一个任务依赖链。
Ext Dag: DAG扩展, DAG生成模板,通过页面配置Ext Dag可以一键生成DAG python配置。
Ext Dag Category: Airflow原生不提供分类的概念,但Console我们扩展了分类功能, 我们创建不同Dag模板可以分属于不同的DAG分类。
Ext Dag Task: Ext Dag的任务,真正任务的封装体,分为Operator和Sensor, 可以组装成Ext Dag.
1.创建业务分类.
我们的调度任务可以根据业务进行分类. 首先创建我们的业务类型.
2.创建dag
3.创建任务
点击task按钮进入task列表, 再点击add添加一个任务.
添加bash任务
添加hive sql任务
添加hive出库到mysql任务, 对应的插件为hive_to_rdbms_operator
4.配置任务依赖关系
Airflow提供了任务上下游依赖的管理方案,具体就是使用python的 >> 语法
a >> b 表示a的{{ds}}的任务执行完毕才可以执行b.
点击更新按钮保存依赖关系.
5.生成dag.py脚本
点击提交按钮, 生成python脚本预览.
确认没有问题后, 提交就可以将dag保存的git仓库. Airflow那边定时拉取git更新即可.
本地启动
启动airflow, 暴露pg端口和webserver端口,
docker-compose.yml
cd doc
docker-compose up
启动后访问localhost:8090即airflow初始化完成.
- 修改本项目db
修改application-dev.yml中DataSource的url host为localhost.
- 导入db
将schema.sql导入pg.
- 启动本项目
访问localhost:8081/api 即swagger地址.
- 启动web
关注我的公众号

【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
· 没有源码,如何修改代码逻辑?
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 记一次.NET内存居高不下排查解决与启示
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了