airflow中跨dag/task的数据传送

默认在airflow中每个task都是独立的进程,无法进行数据交换,但airflow还提供了一个XCom功能,以满足用户的类似需求

下面我们创建两个dag,其中一个push数据,一个pull数据,如下的dag中的task(push)执行完后会推送一条数据到xcom表,key=push ,value=True

复制代码
dag = DAG(
    dag_id='migrate_mongo',
    default_args=args,
    schedule_interval='0 17 * * *',
    catchup=False
)


def push(**kwargs):
    kwargs['ti'].xcom_push(key='status', value=True)

task1 = PythonOperator(task_id='push',
                       python_callable=push,
                       provide_context=True,
                       dag=dag)
复制代码

另起一个dag,创建一个task(pull)可以将上面的dag中的数据获取到

复制代码
dag = DAG(
    dag_id='migrate_mongo2',
    default_args=args,
    schedule_interval='0 17 * * *',
    catchup=False
)


def pull(**kwargs):
    execution_date = kwargs['execution_date']
    v1 = XCom.get_one(dag_id='migrate_mongo', task_id='push', execution_date=execution_date)
    print(v1)

task2 = PythonOperator(task_id='pull',
                       python_callable=pull,
                       provide_context=True,
                       dag=dag)
复制代码

两个dag之间其实通过airflow底层的一张xcom表进行数据交换的

 

posted @   Mars.wang  阅读(2017)  评论(0编辑  收藏  举报
编辑推荐:
· AI与.NET技术实操系列:基于图像分类模型对图像进行分类
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
阅读排行:
· 25岁的心里话
· 闲置电脑爆改个人服务器(超详细) #公网映射 #Vmware虚拟网络编辑器
· 零经验选手,Compose 一天开发一款小游戏!
· 通过 API 将Deepseek响应流式内容输出到前端
· AI Agent开发,如何调用三方的API Function,是通过提示词来发起调用的吗
点击右上角即可分享
微信分享提示