Fork me on GitHub

DataX学习指南(四)-- 项目运行

  上篇文章介绍了源码的打包,这篇文章就主要介绍如何将程序运行起来,并实现数据的同步。

  对于DataX程序运行,有两种方式,上文介绍的自定义插件开发并打包运行是比较复杂的一种;

  而相对简单地一种方式就是直接将datax编译后的文件下载下来。DataX下载地址

  下载后解压至本地某个目录,进入bin目录,即可运行同步作业:

  • $ cd  {YOUR_DATAX_HOME}/bin
    $ python datax.py {YOUR_JOB.json}

    自检脚本:    python {YOUR_DATAX_HOME}/bin/datax.py {YOUR_DATAX_HOME}/job/job.json

  一般情况下,我们会用的数据库读写工具包里面都已经编译好,这种情况下,就只要写job.json了。

  程序启动

  

  运行结果。(在时间同步作业中可将同步结果处理入库,这里默认为打印到控制台)

  

补充

 

 

   oracle2pgsql.json上篇文章已经完整提供了。需要注意的一点就是不同数据库的jdbcUrl不一样,在此我简单整理了一下。有需要的同学可以参考下

 

  另外附上Nosql的默认端口信息

  MongoDB --- 27017
  Redis --- 6379
  Memcached --- 11211
 关于个类数据库的字段映射关系,参考:常见数据库常用数据类型、默认端口

 

 

 

 

 

  

  

 

posted @ 2022-05-09 14:54  JackpotHan  阅读(365)  评论(0编辑  收藏  举报