DataX学习指南(四)-- 项目运行
上篇文章介绍了源码的打包,这篇文章就主要介绍如何将程序运行起来,并实现数据的同步。
对于DataX程序运行,有两种方式,上文介绍的自定义插件开发并打包运行是比较复杂的一种;
而相对简单地一种方式就是直接将datax编译后的文件下载下来。DataX下载地址
下载后解压至本地某个目录,进入bin目录,即可运行同步作业:
-
$ cd {YOUR_DATAX_HOME}/bin $ python datax.py {YOUR_JOB.json}
自检脚本: python {YOUR_DATAX_HOME}/bin/datax.py {YOUR_DATAX_HOME}/job/job.json
一般情况下,我们会用的数据库读写工具包里面都已经编译好,这种情况下,就只要写job.json了。
程序启动
运行结果。(在时间同步作业中可将同步结果处理入库,这里默认为打印到控制台)
补充
oracle2pgsql.json上篇文章已经完整提供了。需要注意的一点就是不同数据库的jdbcUrl不一样,在此我简单整理了一下。有需要的同学可以参考下
另外附上Nosql的默认端口信息
MongoDB --- 27017
Redis --- 6379
Memcached --- 11211
关于个类数据库的字段映射关系,参考:常见数据库常用数据类型、默认端口
作者:JackpotHan
欢迎任何形式的转载,但请务必注明出处。
限于本人水平,如果文章和代码有表述不当之处,还请不吝赐教。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 无需6万激活码!GitHub神秘组织3小时极速复刻Manus,手把手教你使用OpenManus搭建本
· C#/.NET/.NET Core优秀项目和框架2025年2月简报
· Manus爆火,是硬核还是营销?
· 一文读懂知识蒸馏
· 终于写完轮子一部分:tcp代理 了,记录一下