CloudCanal 数据脱敏实践
1.CloudCanal x OceanBase 数据迁移同步优化
2.CloudCanal 数据脱敏实践
3.手把手教你做 Redis 双向数据同步4.国产数据库 GaussDB 数据迁移同步初探5.一镜到底 ElasticSearch 数据迁移同步技术6.花 200 元测试 1300 个实时数据同步任务7.CloudCanal x Debezium 打造实时数据流动新范式8.CloudCanal x Redis 数据同步指令集丰富与细节优化9.如何用 CloudCanal 做多源数据汇聚10.CloudCanal x Hive 构建高效的实时数仓11.Oracle 数据迁移同步优化(三)12.Sap Hana 数据迁移同步优化(二)13.ElasticSearch 到 ElasticSearch 数据迁移同步14.Oracle 到 Clickhouse 数据迁移同步15.CloudCanal & Bytebase 联合解决方案16.Hana 到 PostgreSQL 数据迁移同步17.PostgreSQL 到 PostgreSQL 数据迁移同步18.MySQL 到 ClickHouse 数据同步优化(三)19.Kafka 到 Kafka 数据同步20.Oracle 到 Elasticsearch 数据迁移同步21.SAP HANA 到 MySQL 数据迁移同步22.Redis 到 Redis 数据迁移同步23.2024 年,CloudCanal 做了 3 件事...简述
本文主要介绍使用 CloudCanal 做数据迁移同步时如何对特定数据做脱敏处理。
技术点
自定义代码
CloudCanal 允许用户上传业务代码到数据任务中,完成数据迁移、同步过程中数据处理的目的。
数据同步脱敏也是基于自定义代码实现,具备以下特点:
- 脱敏范围灵活,可选择任何一个或多个表字段
- 脱敏算法可依赖外部算法包
- 脱敏逻辑和策略可自定义
操作示例
脱敏代码开发
- 数据脱敏逻辑开发。Gitee 上完整代码
- 代码打包
- 代码包位置
安装 CloudCanal
- 下载、安装并激活 CloudCanal 私有部署版本
任务创建
- 任务管理 > 创建任务
- 选择源和目标数据库
- 选择增量同步,并勾选数据初始化
- 选择同步表
- 选择列,右上角 上传自定义代码 jar 包
- 创建任务
- 任务结构迁移、全量迁移、增量同步,正常运行
验证数据
- 源端与目标端数据
- 对测试表造一些 DML 操作后,源端和目标端数据
常见问题
目前还存在什么问题?
- 只支持 Java 语言,对于非开发同学不够友好,后续希望能支持常用脚本语言。
- 数据校验和数据订正暂时不支持,对于基于自定义代码实现的数据迁移同步,无法做到数据质量校验。
总结
主要介绍使用 CloudCanal 做数据迁移同步时数据脱敏工作。
合集:
CloudCanal
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 一个费力不讨好的项目,让我损失了近一半的绩效!
· 实操Deepseek接入个人知识库
· CSnakes vs Python.NET:高效嵌入与灵活互通的跨语言方案对比
· 【.NET】调用本地 Deepseek 模型
· Plotly.NET 一个为 .NET 打造的强大开源交互式图表库