airflow安装文档

通过pip 包方式安装 airflow

pip3 install apache-airflow -i http://mirrors.aliyun.com/pypi/simple/

python3的话需要有pymysql包, 没有的话安装:

pip3 install pymysql -i http://mirrors.aliyun.com/pypi/simple/

在MySQL上配置airflow相关表

--创建数据库
create database airflow;
--将数据库airflow的所有权限授权airflow用户,密码''且该用户可在任何IP段登录操作
GRANT all privileges on airflow.* TO 'airflow'@'%' IDENTIFIED BY '你的密码';
--刷新权限
FLUSH PRIVILEGES;
--不配会报错: Exception: Global variable explicit_defaults_for_timestamp needs to be on (1) for mysql
use airflow;
set global explicit_defaults_for_timestamp = 1;

vim ~/airflow/airflow.cfg 修改airflow配置文件, 修改以下两项:

# 改为本地调度器(默认并发调度16)
executor = LocalExecutor 
# 配置mysql
sql_alchemy_conn = mysql+pymysql://airflow:你的密码@127.0.0.1:3306/airflow

初始化数据库

  • 若之前没有初始化

    • airflow initdb
  • 若之前初始化过

    • airflow resetdb

遇到的一个Bug

sqlalchemy.exc.InternalError: (pymysql.err.InternalError) (1050, "Table 'dag_stats' already exists")
[SQL: 
CREATE TABLE dag_stats (
	dag_id VARCHAR(250) NOT NULL, 
	state VARCHAR(50) NOT NULL, 
	count INTEGER NOT NULL, 
	dirty BOOL NOT NULL, 
	PRIMARY KEY (dag_id, state), 
	CHECK (dirty IN (0, 1))
)
  • dag_stats表已经存在

  • 解决方案:

    use airflow;
    drop table dag_stats;
    
    • 然后再airflow resetdb
posted @ 2020-04-09 17:51  wellDoneGaben  阅读(568)  评论(0编辑  收藏  举报