实时电商数仓（九）之数据采集（八）数据库数据采集（三）canal安装

1.1 导入模拟业务数据库

1.2 赋权限

在mysql中执行

GRANT SELECT, REPLICATION SLAVE, REPLICATION CLIENT ON *.* TO 'canal'@'%' IDENTIFIED BY 'canal' ;

1.3 修改/etc/my.cnf文件

server-id= 1
log-bin=mysql-bin
binlog_format=row
binlog-do-db=gmallXXXXX

1.4 重启Mysql

2.1 canal的下载

https://github.com/alibaba/canal/releases

把canal.deployer-1.1.4.tar.gz拷贝到linux,解压缩

vim conf/canal.properties

这个文件是canal的基本通用配置，主要关心一下端口号，不改的话默认就是11111

vim conf/example/instance.properties

instance.properties是针对要追踪的mysql的实例配置

2.3 把canal目录分发给其他虚拟机

2.4 在2-3台节点中启动canal

启动canal

./bin/startup.sh

2.5 只是高可用，不是高负载

这种zookeeper为观察者监控的模式，只能实现高可用，而不是负载均衡，即同一时点只有一个canal-server节点能够监控某个数据源，只要这个节点能够正常工作，那么其他监控这个数据源的canal-server只能做stand-by，直到工作节点停掉，其他canal-server节点才能抢占。

/bigdata/kafka_2.11-0.11.0.2/bin/kafka-console-consumer.sh --bootstrap-server  hadoop1:9092,hadoop2:9092,hadoop3:9092 --topic  GMALL2020_DB

分布式架构图

posted @ 2020-09-12 21:29 秋华阅读(328) 评论(0) 编辑收藏举报

刷新页面返回顶部

秋华