我家很管事的猫——mycat初步部署实践与问题排查

mycat,阿里出品的mysql中间件,提供读写分离和分库分表方案。项目中主要使用的是其读写分离功能。

【如何部署?】

本文只采用并测试了双主从模式,配置看这一篇足矣:

https://www.cnblogs.com/biglittleant/p/7059569.html

需要注意在配置并启动mycat之前一定要完成mysql物理节点之间主从复制配置,并保证每个节点show slave status\G中

SLAVE_SQL_RUNNING、SLAVE_IO_RUNNING都为YES。

然后启动mycat,一般不会发生问题。

对dataHost的三个参数进行解读:

<dataHost name="mysqlms" maxCon="2000" minCon="20" balance="1"
writeType="0" dbType="mysql" dbDriver="native" switchType="1" slaveThreshold="100">

其中,balance指的负载均衡类型。

1. balance="0", 不开启读写分离机制,所有读操作都发送到当前可用的writeHost上。

2. balance="1",全部的readHost与stand by writeHost参与select语句的负载均衡,简单的说,当双主双从模式(M1->S1,M2->S2,并且M1与 M2互为主备),正常情况下,M2,S1,S2都参与select语句的负载均衡。

3. balance="2",所有读操作都随机的在writeHost、readhost上分发。

4. balance="3",所有读请求随机的分发到wiriterHost对应的readhost执行,writerHost不负担读压力

writeType指写操作模式。

1. writeType=“0”, 所有写操作都发送到可用的writeHost上。
2. writeType=“1”,所有写操作都随机的发送到readHost。
3. writeType=“2”,所有写操作都随机的在writeHost、readhost分上发。

switchType指的是切换的模式。

1. switchType='-1' 表示不自动切换

2. switchType='1' 默认值,表示自动切换

3. switchType='2' 基于MySQL主从同步的状态决定是否切换,心跳语句为 show slave status

4. switchType='3'基于MySQL galary cluster的切换机制(适合集群),心跳语句为 show status like 'wsrep%'。

目前还没有尝试过双主节点同时挂掉的情况,switchType暂且使用了默认值。这里有待后续测试。

【日志级别】
/.../mycat/conf/log4j2.xml
<asyncRoot level="debug"

此时能够看到mycat负载路径,很实用。

另外附上mysql在配置文件my.cnf中打开bin日志和普通日志的方式,尤其是普通日志,配合mycat日志可以更好地理解读写分离实现过程。

普通
general_log=1

general_log_file=/usr/local/log/query.log

SHOW GLOBAL VARIABLES LIKE 'general%';(查看开启状态,如未成功查看mysql日志mysqld.log)

二进制
log_bin=mysql-bin

SHOW GLOBAL VARIABLES LIKE '%log%';(查看开启状态,如未成功查看mysql日志mysqld.log)

【监控】

这里我试用了mycat-eye,个人感觉并不是很好用,很多项是空白也不清楚怎么开启,但至少可以很方便的获得物理节点的心跳状态。

【节点down掉】

写节点down掉之后其读节点也会失效,一般情况下重连之后此主从仍会作为mycat集群中承担读任务的节点。
mysql的主从同步线程重启时间较长,估算约30秒,估计还会受期间发生的事务数量影响。
好处是节点down掉之后重连会自动同步(只要双主从初始配置正常),不用手动修改mysql主从复制配置。

【写主节点down掉】
mycat在检测到写主节点会尝试将主节点分配给写从节点。并在dnindex.properties记录,dataHost name=? 为0时表示M1,为1时表示M2。

注意:在down掉的写主节点重新连接或将mycat重启后此值依然不变。指定写主节点需要手动修改并重启mycat。

【偶发bug】
1、【数据不一致】mycat对于即时性高的事务支持是比较稳定的,测试中与代码执行逻辑相违背的数据不一致情况极偶发,其中**在写主节点down掉重新启动之后必发**。
未及时情况原因:在mycat中,部分写sql发生在读sql之后。

2、down掉重启之后可能不会再将读请求分配给写从节点及其读从节点,这里可能涉及负载均衡策略,还需进一步测试。

【其他问题排查,mysql本身问题居多】

1、【navicat前端不能直接操作mycat?数据会不一致?】

这个问题比较具有迷惑性,经测试,navicat操作mycat节点时,sql与jdbc连接mycat执行的sql无异,都是先发送至mycat由其进行负载分配(可查看日志mycat.log验证),update语句在writeType=“0”的情况下一定由写主节点完成。

如果不经由mycat而直接在写节点或读节点操作,mycat不会形成日志。

后来查清当时之所形成这样的认知,是因为其中一个读节点,由于服务器上其他应用的日志文件迅速占满了空间而导致mysql主从同步的线程阻塞,而mycat并未发现异常,继续为此节点分配读任务,导致数据不一致。

解决方法腾出空间即可,无需对该节点mysql进行额外操作。

实际上,当其中一个节点出现磁盘空间已满这种问题时,在navicat连接mycat打开一个表,反复刷新就会发现数据不一致情况。

mycat能否发现出问题的读节点并将其排除,有待进一步研究。

2、【SLAVE_SQL_RUNNING、SLAVE_IO_RUNNING为NO】

(1)SLAVE_SQL_RUNNING为NO可单独尝试reset master;看能否生效。

(2)SLAVE_IO_RUNNING为NO

到主库上show master status查一下主库当前的gtid(Executed_Gtid_Set),
然后到从库执行下面命令:
reset master;
stop slave;
set global gtid_purged = 'xxxx'; -- 这里xxxx是主库的Executed_Gtid_Set,可以为空噢
start slave;

意思是从库同步时,丢弃现有主库执行过的gtid。

(3)以上若不能解决,看日志/var/log/mysqld.log对症下药。

对于网上的一些change master解决方式,在GTID模式开启的情况下,

gtid-mode=on
enforce-gtid-consistency

不用重新指定change master to master_log_file='mysql-bin.xxxxxx',master_log_pos=xxx;

 3、【我用navicat打开某个schema之后刷新,看到的“行”、“自动递增值”、“修改日期”不一样?】

首先,这里的统计数据是由SHOW TABLE STATUS得到的。每个表内的记录实际上是完全一致的。

(1)“行”:这里引用CSDN论坛小小小小周的回答:

“部分存储引擎,如MyISAM,存储精确的数目。
对于其它存储引擎,比如InnoDB,本值是一个大约的数,与实际值相差可达40到50%。在这些情况下,使用SELECT COUNT(*)来获得准确的数目。
对于在INFORMATION_SCHEMA数据库中的表,Rows值为NULL”

(2)“自动递增值”:在,除了主写节点以外,其他承担读任务的节点increment应该都一致并比主写节点少1。

(increment可以通过 SELECT auto_increment FROM information_schema.tables where table_schema="dbName" and table_name="tableName";单独查看,值和SHOW TABLE STATUS得到的相同。)

查看my.cnf中的配置,两个写节点(或称M节点)的offset一个为1另一个为2。

auto-increment-offset=x
auto-increment-increment=2

为了实现双主从模式的事务控制和切换,increment设置为2。由此导致主写节点比当前存在的最大一个id多2,其他节点(同步自己的主节点)比当前存在的最大一个id多1,注意这里设置了increment为2的另一写节点同样比当前存在的最大一个id多1。

另猜测,**在写主节点down掉重新启动之后必发**的数据不一致bug可能与此有关,有待进一步测试。

(3)“修改日期”:这个值应该只有微小不一致,因为各节点主从同步时间有微小差别。当然,这里的信息都不完全准确。

不当之处恳请各位指教,下篇jenkins。

【190103补充】

经测试,update等DML操作可以正常加行锁,而select...for update被mycat视作普通select,也就是说不会把select...for update分配到主写节点。

但是,在使用mybatis+spring的情况下,在select方法上加@Transaction注解(如果写在更外层则不会影响select方法)可以由主写节点处理查询,这时select...for update即可正常加锁了。

posted on 2018-12-28 16:16  kurama2018  阅读(781)  评论(0编辑  收藏  举报