MyCAT常用分片规则之分片枚举
MyCAT支持多种分片规则,下面测试的这种是分片枚举。
适用场景,列值的个数是固定的,譬如省份,月份等。
在这里,需定义三个值,规则均是在rule.xml中定义。
-
tableRule
-
function
-
mapFile
一、在rule.xml中定义tableRule
<tableRule name="sharding-by-intfile-test">
<rule>
<columns>province</columns>
<algorithm>hash-int-test</algorithm>
</rule>
</tableRule>
其中,sharding-by-intfile-test是规则名,会在schema.xml中用到。
columns指的是对省份进行分片。
algorithm是算法名,该算法必须在function中定义。
二、在rule.xml中定义function
<function name="hash-int-test"
class="org.opencloudb.route.function.PartitionByFileMap">
<property name="mapFile">partition-hash-int-test.txt</property>
<property name="type">1</property>
<property name="defaultNode">0</property>
</function>
其中,mapFile指的是配置文件名
type默认值为0,0表示Integer,非零表示String。因为我接下来的测试是基于省份分片,所以需type指定为1。
defaultNode 默认节点:小于0表示不设置默认节点,大于等于0表示设置默认节点
默认节点的作用:枚举分片时,如果碰到不识别的枚举值,就让它路由到默认节点。如果不配置默认节点(defaultNode值小于0表示不配置默认节点),碰到不识别的枚举值就会报错,like this:can’t find datanode for sharding column:column_name val:ffffffff
三、在rule.xml当前目录下创建【partition-hash-int-test.txt】文件,定义枚举的规则
hubei=0 # 第一个数据节点
tianjin=1 # 第二个数据节点
guangdong=2 # 第三个数据节点
其中,hubei会被分发到第一个节点中,tianjin分发被第二个节点中,guangdong第三个节点中。
四、现在开始测试
首先,在shema.xml定义表的分片规则
<table name="t_vote" dataNode="dn2,dn1,dn3" rule="sharding-by-intfile-test" />
登录MyCAT创建表
# mysql -utest -ptest -h127.0.0.1 -P8066 -DTESTDB
mysql> create table t_vote(id varchar(10),province varchar(10));
mysql> insert into t_vote(id,province) values(database(),'hubei');
mysql> insert into t_vote(id,province) values(database(),'tianjin');
mysql> insert into t_vote(id,province) values(database(),'guangdong');
mysql> insert into t_vote(id,province) values(database(),'shandong');
mysql> select * from t_vote;
+------+-----------+
| id | province |
+------+-----------+
| db1 | tianjin |
| db2 | hubei |
| db2 | shandong |
| db3 | guangdong |
+------+-----------+
hubei之所以是db2,因为它对应的是第一个节点,而在schema.xml定义t_vote表时,第一个节点即是dn2。
shandong之所以是在db2,因为它并没有在分片规则中定义,所以会被分到默认节点,默认节点defaultNode的是0,即第一个节点。
总结:
- 刚开始没有指定function中type的值,即
<property name="type">1</property>
。导致insert时报以下错误,因为默认的分片类型是integer,而不是string。
mysql> insert into t_vote(id,province) values(database(),'hubei');
ERROR 1064 (HY000): For input string: "hubei"
- 如果没有指定function中defaultNode值,则插入不识别的枚举值时,报以下错误:
mysql> insert into t_vote(id,province) values(database(),'shandong');
ERROR 1064 (HY000): can't find any valid datanode :T_VOTE -> PROVINCE -> shandong
- MyCAT其实还支持动态加载功能
譬如,我将defaultNode的值定义到partition-hash-int-test.txt中,哈哈,这点也是支持的。当然,前提是注释掉function中defaultNode值,不然function中的defaultNode值会覆盖掉partition-hash-int-test.txt中DEFAULT_NODE值。
hubei=0
tianjin=1
guangdong=2
DEFAULT_NODE=2
登录到MyCAT 9066管理端口# mysql -utest -ptest -h127.0.0.1 -P9066
mysql> reload @@config;
Query OK, 1 row affected (0.03 sec)
Reload config success
登录到MyCAT 8066端口# mysql -utest -ptest -h127.0.0.1 -P8066 -DTESTDB
mysql> insert into t_vote(id,province) values(database(),'shanxi');
mysql> select * from t_vote;
+------+-----------+
| id | province |
+------+-----------+
| db1 | tianjin |
| db2 | hubei |
| db2 | shandong |
| db3 | guangdong |
| db3 | shanxi |
+------+-----------+
5 rows in set (0.01 sec)
- 该规则有个问题,如果中途修改了defaultNode的值,譬如,我刚开始设置的是0,插入了shandong这个值,现在修改为2。
根据where条件无法检索出原来插入的值。
日志中显示的信息如下:
01/24 15:17:50.028 DEBUG [$_NIOREACTOR-0-RW] (EnchachePool.java:76) -SQLRouteCache miss cache ,key:TESTDBselect * from t_vote where province='shandong'
01/24 15:17:50.029 DEBUG [$_NIOREACTOR-0-RW] (EnchachePool.java:59) -SQLRouteCache add cache ,key:TESTDBselect * from t_vote where province='shandong' value:select * from t_vote where province='shandong', route={
1 -> dn3{SELECT *
FROM t_vote
WHERE province = 'shandong'
LIMIT 100}
}
dn3是现在的defaultNode=2所对应的节点。