Flink-cdc所带来的问题_flinkcdc缺点.md
标题: Flink-cdc所带来的问题
日期: 2021-11-28 22:45:09
标签: [flink,flink-cdc]
分类: Flink
今天说下flink-cdc吧,最近工作中遇到了一个比较棘手的问题。
我们都知道flink对比其他流计算引擎,其中一个优势就是cdc,它能够作为各个数据源的source和sink,实时接入和实时推送数据,为我们解决了实时接入和推送的问题。
工作中用到了flink mysql-cdc,实时导入mysql数据的增删改,你需要做的就是简单配置一个sql,即可搞定,看下面:
-- 在Flink创建订单实收source表
CREATE TABLE order_info (
orderCode STRING,
serviceCode STRING,
accountPeriod STRING,
subjectName STRING ,
subjectCode STRING,
occurDate TIMESTAMP,
amt DECIMAL(11, 2),
status STRING,
proc_time AS PROCTIME() -–使用维表时需要指定该字段
) WITH (
'connector' = 'mysql-cdc',
'hostname' = '******',
'port' = '3307',
'username' = '******',
'password' = '******',
'database-name' = 'cdc',
'table-name' = '***',
);
1234567891011121314151617181920
是不是很简单。
一般,如果我们要实时接入mysql的增删改数据,到kafka,通过canal、debezium、maxwell等工具实现,你要做的就是搭一套相应的工作环境,才能顺利到达kafka。
现在我碰到的一个问题是,flink-cdc接入mysql数据,开通了mysql的binlog,当flink去读取binlog之前,会先lock对应mysql实例中的所有库表,不让其他客户端连接做dml操作。
当读完了binlog之后,会释放该锁,其他程序可以正常dml操作了,然后继续锁表,不停循环。
这里有问题的就是,在锁表期间,其他所有表也均不能做dml操作,这时,如果有程序需要做dml操作时,会等待flink-cdc释放全局锁,释放完之后,再进行dml操作。
所以flink-cdc会影响到其他程序的写动作,影响到了业务。
那么有什么解决办法呢?
分析原因,大概了解到,flink-cdc底层也是通过debezium实现的监控mysql binlog,实现实时获取增删改数据,那么该平台在同步binlog时,读取binlog确实需要锁住mysql,不然在读取的时候,还有日志写入binlog,导致读取混乱,所以全局锁是在所难免的。
那怎么办呢?
归其原因,就是业务库mysql和数据同步的对对应的mysql相同,导致在做数据同步的时候,会有影响,如果mysql不一样呢?业务库专门做业务,另一个mysql专门做数据同步,这个mysql作为业务库的slave不就行了?这样互不干扰。
或者大家有没有其他同步mysql增删改数据的方案呢?
欢迎留言。
齐家,治国,平天下。
欢迎关注我的微信公众号,比较喜欢分享知识,也喜欢宠物,所以做了这2个公众号:
喜欢宠物的朋友可以关注:【电巴克宠物Pets】
一起学习,一起进步。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 记一次.NET内存居高不下排查解决与启示
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了