手把手教你 Apache DolphinScheduler 本地开发环境搭建 | 中英文视频教程

点击上方 376ac3852662ce9a76f850607d87132b.png蓝字关注我们

6be0c6b9683fe4dc0f56f5fa4e1ab94c.png

最近,一些小伙伴反馈对小海豚的本地开发环境搭建过程不太了解,这不就有活跃的贡献者送来新鲜的视频教程!在此感谢@Tianqi-Dotes 的细致讲解0265674b5a0ad2ffc0d05bb4d2d5d0c4.png

贡献者还贴心地录制了中英文两个视频版本,快来学习下吧!

4bbd6a8b70fd523bf4339306bc6911d0.png

中文版

英文版

bd6c7beebca74da4e31a804f3d4762cc.png

操作步骤详解

2ff244cbacc065701828ddecd67bbae4.png

今天来告诉大家如何在本地搭建 DolphinScheduler 源码的开发环境以及对DolphinScheduler 源码的本地启动和调试

首先,我们打开 DolphinScheduler 官网,找到开发者菜单后,进入开发者指南。指南非常详细地介绍了如何搭建开发环境,以及如何对前端后端进行开发。

那么我们跟随官方的指引,进行 DolphinScheduler 的搭建,启动与调试。这里的笔记,我提前汇总了整个搭建过程。

首先,到 Github 上下载所有的源码,我们打开 DolphinScheduler 的 GitHub(https://github.com/apache/dolphinscheduler)。

在 GitHub 上我们可以通过 git clone 或者直接 download code。

我们选择浏览器下载 zip 压缩包,这里已经下好了。

接下来我们需要在本地安装一个 zk

首先我们打开 zk 官网,进入 releases 页面选择一个版本进行下载。这里也已经下载好了。

首先先解压 zk 和 DolphinScheduler 的压缩包。

我们先进行 zk 的安装。打开文件夹。需要在里面新建两个目录,data 和 log。Data 用于存放 zk 的数据信息,log 用于存放 zk 的日志信息。

然后我们进入 conf 配置文件夹,将 zoo_sample.cfg 复制一份,并更名为 zoo.cfg.

然后修改里面的参数,将 data 和 log 路径设置到配置文件中,dataDir 和 dataLogDir。

接下来进入 bin 目录。直接点击 zkServer.cmd 文件进行启动。当我们看到命令行窗口就是启动了。

我们再打开客户端 zkcli 进行连接验证。

输入 ls /查看根节点的状态。看到一个节点叫 zookeeper,说明 zk 启动成功。

这样安装和启动 zk 就完成了。

下来我们为 DolphinScheduler 新建一个调试用的数据库

我们通过 mysql 连接工具 navicat,创建一个数据库 DolphinSchedulertest。字符集选择utf8。

下来我们将源码导入到 IDE 中。在 IDEA 里选择 open 解压的 DolphinScheduler 文件夹。

接下来 idea 会根据 maven 依赖进行下载和解析。

待 IDE 读取完毕。

然后我们需要做一些配置修改。

我们需要把 pom 中,mysql-connector-java 的 scope 改为 compile。

打开 pom 文件搜索 connector,进行修改。

重新 reimport maven。

然后将 dao 模块中默认的 mysql datasource 设置改为我们刚才创建的库信息。

我们打开 dao 模块,resource 里的 datasource.properties 件。将 mysql 配置修改并注释 postgresql 配置。

接下来运行 dao 模块初始化数据库方法,这个方法会将 DolphinScheduler所需要的数据和表自动导入目标数据库。

我们直接运行CreateDolphinScheduler里的main方法。代码就开始向数据库导入数据。

结束之后,我们可以刷新数据库,所有的初始数据已经创建完成。 

下来我们需要,将 DolphinScheduler-service 模块的 zk 配置改成我们本地启动的 zk 配置,localhost:2181.

打开 service 模块,resources 文件夹里的 zookeeper.properties 文件。如果已经是 localhost:2181 就不需要修改了。

下来我们可以将 worker server 日志添加在控制台中,打开 server 模块,resources 文件夹下,logback-worker 文件中,在 logback 配置中添加 STOUT 本地控制台的打印。

同样可以在 master、api 模块中添加 stout 日志打印。

接下来我们启动 4 个主服务

第一个是执行 org.apache.dolphinscheduler.server.master.MasterServer 的 main 方法 。

搜索 MasterServer,在 server 模块下。

在启动之前,需要添加一些启动参数配置。在 IDEA 中新建一个 application,选择masterserver 这个类。设置 vm options 启动参数,指定日志配置文件和druid参数。将模块的 classpath 设置为 server 模块。

然后再找到 workerserver,做同样的参数配置。设置为 worker 日志配置文件以及 server 模块 classpath。这样 master 和 worker 就配置好了。

然后还需要配置 apiserver,同样指定日志文件以及 api 模块。

这样 3 个启动模块就配置完成。

接下来我们尝试启动,先启动 master,再启动 worker,接着启动 api

如果我们要用到日志功能,那么可以直接启动 loggerserver,不需要任何配置。日志功能包含工作流实例执行后的查看任务日志功能。

这时可以尝试访问后端的 swagger 文档。后台的接口都已经可以列出来了。这说明启动成功。

然后我们着手启动前端。打开 ui 模块,打开 windows explorer。

我的 node 版本是 12.20.2。

首先 npm install 安装前台需要的相关依赖,最好是 nodejs

安装完成后,我们通过 npm run start 启动

然后访问 localhost: quadruple 8888, 使用默认的账号admin,密码dolphinscheduler123。登录成功。

可以看到我们已经成功地启动了 DolphinScheduler 前台和后台。这样我们就可以在本地环境进行 DolphinScheduler 开发和调试!

这就是今天视频的全部内容了,谢谢!

That’s all for today’s video, thanks!

b8e17e06dedc057f489c9f24c681ff95.png


 

083bcac1aee7ff9170639e258fb48693.gif


 

美女亲自带你快速上手 DolphinScheduler

☞Apache DolphinScheduler 1.3.8 发布

☞Apache DolphinScheduler使用规范与使用技巧分享

点击阅读原文,加入开源!

248814c6de25629ba27499c31b49f95c.png

点个在看你最好看

posted @ 2021-10-14 19:00  海豚调度  阅读(1008)  评论(0编辑  收藏  举报