上一页 1 ··· 322 323 324 325 326 327 328 329 330 ··· 404 下一页
摘要: Airflow具有非常丰富的命令行界面,允许在DAG上执行多种类型的操作,启动服务以及支持开发和测试。 usage : airflow [ - h ] { resetdb , render , variables , connections , create_user , pause , task_ 阅读全文
posted @ 2018-11-29 17:57 绝不原创的飞龙 阅读(30) 评论(0) 推荐(0) 编辑
摘要: 使用数据生产效率的一部分是拥有正确的武器来分析您正在使用的数据。 Airflow提供了一个简单的查询界面来编写SQL并快速获得结果,以及一个图表应用程序,可以让您可视化数据。 临时查询 adhoc查询UI允许与Airflow中注册的数据库连接进行简单的SQL交互。 图表 基于flask-admin和 阅读全文
posted @ 2018-11-29 13:51 绝不原创的飞龙 阅读(16) 评论(0) 推荐(0) 编辑
摘要: Airflow Platform是用于描述,执行和监控工作流的工具。 核心理念 DAG的 在Airflow中, DAG (或定向非循环图)是您要运行的所有任务的集合,以反映其关系和依赖关系的方式进行组织。 例如,一个简单的DAG可以包含三个任务:A,B和C.可以说A必须在B可以运行之前成功运行,但C 阅读全文
posted @ 2018-11-29 13:49 绝不原创的飞龙 阅读(36) 评论(0) 推荐(0) 编辑
摘要: 通过Airflow UI,您可以轻松监控数据管道并对其进行故障排除。 以下是您可以在Airflow UI中找到的一些功能和可视化的快速概述。 DAGs查看 您环境中的DAG列表,以及一组有用页面的快捷方式。 您可以一目了然地查看成功,失败或当前正在运行的任务数量。 树视图 跨越时间的DAG的树表示。 阅读全文
posted @ 2018-11-29 13:48 绝不原创的飞龙 阅读(13) 评论(0) 推荐(0) 编辑
摘要: Airflow具有一组固定的“测试模式”配置选项。 您可以随时通过调用airflow.configuration.load_test_config()来加载它们(注意此操作不可逆!)。 但是,在您有机会调用load_test_config()之前,会加载一些选项(如DAG_FOLDER)。 为了急切 阅读全文
posted @ 2018-11-29 13:46 绝不原创的飞龙 阅读(17) 评论(0) 推荐(0) 编辑
摘要: Airflow可以与基于upstart的系统集成。 Upstart会在系统启动时自动启动/etc/init具有相应*.conf文件的所有气流服务。 失败时,upstart会自动重启进程(直到达到*.conf文件中设置的重新生成限制)。 您可以在scripts/upstart目录中找到示例新贵作业文件 阅读全文
posted @ 2018-11-29 13:45 绝不原创的飞龙 阅读(9) 评论(0) 推荐(0) 编辑
摘要: Airflow可以与基于系统的系统集成。 这使得观察您的守护进程变得容易,因为systemd可以在失败时重新启动守护进程。 在scripts/systemd目录中,您可以找到已在基于Redhat的系统上测试过的单元文件。 您可以将它们复制到/usr/lib/systemd/system 。 假设Ai 阅读全文
posted @ 2018-11-29 13:44 绝不原创的飞龙 阅读(13) 评论(0) 推荐(0) 编辑
摘要: 有两种方法可以将气流作为mesos框架运行: 直接在mesos从站上运行气流任务,要求每个mesos从站安装和配置气流。在安装了气流的docker容器内运行气流任务,该容器在mesos slave上运行。 任务直接在mesos从站上执行 MesosExecutor允许您在Mesos群集上安排气流任务 阅读全文
posted @ 2018-11-29 13:43 绝不原创的飞龙 阅读(12) 评论(0) 推荐(0) 编辑
摘要: DaskExecutor允许您在Dask分布式群集中运行Airflow任务。 Dask集群可以在单个机器上运行,也可以在远程网络上运行。 有关完整详细信息,请参阅分布式文档 。 要创建集群,首先启动调度程序: # default settings for a local cluster DASK_H 阅读全文
posted @ 2018-11-29 13:41 绝不原创的飞龙 阅读(22) 评论(0) 推荐(0) 编辑
摘要: CeleryExecutor是您扩展工人数量的方法之一。 为此,您需要设置Celery后端( RabbitMQ , Redis ,…)并更改airflow.cfg以将执行程序参数指向CeleryExecutor并提供相关的Celery设置。 有关设置Celery代理的更多信息,请参阅有关该主题的详尽 阅读全文
posted @ 2018-11-29 13:40 绝不原创的飞龙 阅读(20) 评论(0) 推荐(0) 编辑
上一页 1 ··· 322 323 324 325 326 327 328 329 330 ··· 404 下一页