datax 使用 增量同步需要动态传入参数
datax 使用
阿里开源,主要用于离线数据同步。
使用简单,主要就是写 json 配置对应的参数,重哪里读 写到哪里去,中间可以转换 脱敏等。
环境 依赖Python
装好环境简单使用
python E:\datax\bin\datax.py E:\datax\job\mysqltomysql.json
增量同步需要动态传入参数 也就是sql where 的条件
"querySql":[
"select id,name,product_ids from XXXX where id>$startId and id<=$endId;"
],
执行命令 python E:\datax\bin\datax.py E:\datax\job\mysqltomysqljsonid.json -p"-DstartId=1 -DendId=2"
一般离线数据就是 定时调度
-
简单点可以 linux corn + shell
-
开源 datax-web
-
直接项目里面订单调度 Java 执行命令行 commons-exec
/** * 1、简单任务示例(Bean模式) */ @XxlJob("job") public void demoJob() throws Exception { String line = "python E:\\datax\\bin\\datax.py E:\\datax\\job\\mysqltomysqljsonid.json"; CommandLine cmdLine= CommandLine.parse(line); DefaultExecutor executor = new DefaultExecutor(); int exitValue = executor.execute(cmdLine); //System.out.println("exit value = " + exitValue); // default success }
总结:离线同步一般就是定时 同步,开源的还要很多 kettle 等,一般展示数据的时候 会展示出最新数据的同步时间,datax 也是支持的 。
elk
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· AI 智能体引爆开源社区「GitHub 热点速览」
· C#/.NET/.NET Core技术前沿周刊 | 第 29 期(2025年3.1-3.9)
· 从HTTP原因短语缺失研究HTTP/2和HTTP/3的设计差异