通过 mycat 实现数据库分表

一、JDK安装
  • 使用mycat来分表需要jdk8及以上的支持。
  • 安装jdk(jdk-8u20-linux-x64.tar.gz)我这个安装包是从网站下载来后传到linux系统中的。
    • 也可以使用命令“yum search java | grep -i --color JDK”来查看有哪些版本的JDK
    • 选择合适的版本,用命令“yum install java-1.8.0-openjdk-devel.x86_64”来下载安装。
      • 如果是用已经下载好的包,解压后在进行下面步骤(解压的是不会出现下图内容的)。
    • 出现如下图显示时,输入y,进行安装
    • 配置环境变量,使用命令“vim /etc/profile”打开文件,在文件的最后输入以下内容:
      • export JAVA_HOME=/wwwroot/service/jdk1.8.0_20  #jdk安装目录
      • export CLASSPATH=.:$JAVA_HOME/lib:$CLASSPATH
      • export PATH=$PATH:$JAVA_PATH/bin
      • 结果如下图:
    • 保存退出后使用命令“source /etc/profile”刷新配置
    • 测试安装是否成功,任意目录输入命令“javac”,可以看到如下内容说明成功
 
 
二、Mycat单库分表
Mycat下载地址:http://dl.mycat.org.cn/,mycat官网:http://www.mycat.org.cn/
 
mycat是开箱即用的,不需要过多的设置。我使用的是Mycat-server-1.6.7.3-release-20190828135747-linux.tar.gz版本的。
 
找个目录,使用解压命令“tar -zxvf Mycat-server-1.6.7.3-release-20190828135747-linux.tar.gz”,解压后 cd 到目录中可以看到如下目录结构:
 
进入到conf目录中进行配置,conf目录结构如下,图中的(.bak)文件是我自己备份的。
 
我们主要使用server.xml,schema.xml,rule.xml这三个文件对mycat进行配置。
1、server.xml:
    打开server.xml文件,我们主要看图中的几个配置项
    
        server.xml 中的标签本就不多,这个标签主要用于定义登录 mycat 的用户和权限。例如上面的例子中,我定义了一个用户,用户名为 root、密码为123456 ,可访问的 schema 也只有 TESTDB 一个。TESTDB是一个逻辑数据库。如果我在 schema.xml 中定义了多个 schema,那么这个用户是无法访问其他的 schema。在 mysql 客户端看来则是无法使用 use 切换到这个其他的数据库。
        如果使用了 use 命令,则 mycat 会报出这样的错误提示:ERROR 1044 (HY000): Access denied for user 'test' to database 'xxx'。这个标签嵌套的 property 标签则是具体声明的属性值,正如上面的例子。我们可以修改 user 标签的name 属性来指定用户名;修改 password 内的文本来修改密码;修改 readOnly 为 true 或 false 来限制用户是否只是可读的;修改 schemas 内的文本来控制用户可访问的 schema,同时访问多个 schema 的话使用 , 隔开,例如:<property name="schemas">TESTDB,db1,db2</property>
 
 
2、schema.xml:
    打开schema.xml文件,是如下配置内容:
    
 
    我把其中不需要的table标签和dataNode标签都删除了。并做了自己的配置,如下图内容:
    
 
2.1、schema 标签:
<schema name="TESTDB" checkSQLschema="false" sqlMaxLimit="100"></schema>
schema 标签用于定义 MyCat 实例中的逻辑库,MyCat 可以有多个逻辑库,每个逻辑库都有自己的相关配置。可以使用 schema 标签来划分这些不同的逻辑库。如果不配置 schema 标签,所有的表配置,会属于同一个默认的逻辑库。
 
 
2.2、table 标签:
<table name="test" primaryKey="ID" subTables="test_$1-3" autoIncrement="true" dataNode="dn1" rule="mod-long" />
Table 标签定义了 MyCat 中的逻辑表,所有需要拆分的表都需要在这个标签中定义。
  • name 属性
    • 定义逻辑表的表名,这个名字就如同我在数据库中执行 create table 命令指定的名字一样,同个 schema 标签中定义的名字必须唯一
    • name="test",test是mysql中真实的表,名字要一样。我这表是没有表前缀的,如果有表前缀也要添加上
    • name值要跟server.xml配置文件中property标签name="schemas"的值一致,这样才能找到对应的库
  • dataNode 属性
    • 定义这个逻辑表所属的 dataNode, 该属性的值需要和 dataNode 标签中 name 属性的值相互对应。如果需要定义的 dn 过多 可以使用如下的方法减少配置:
      • <table name="travelrecord" dataNode="multipleDn$0-99,multipleDn2$100-199" rule="auto-sharding-long" ></table>
      • <dataNode name="multipleDn$0-99" dataHost="localhost1" database="db$0-99" ></dataNode>
      • <dataNode name="multipleDn2$100-199" dataHost="localhost1" database=" db$100-199" ></dataNode>
      • 这里需要注意的是 database 属性所指定的真实 database name 需要在后面添加一个,例如上面的例子中,我需要在真实的 mysql 上建立名称为 dbs0 到 dbs99 的 database。 
  • primaryKey 属性
    • 该逻辑表对应真实表的主键,例如:分片的规则是使用非主键进行分片的,那么在使用主键查询的时候,就会发送查询语句到所有配置的 DN 上,如果使用该属性配置真实表的主键。难么 MyCat 会缓存主键与具体 DN 的信息,那么再次使用非主键进行查询的时候就不会进行广播式的查询,就会直接发送语句给具体的 DN,但是尽管配置该属性,如果缓存并没有命中的话,还是会发送语句给具体的 DN,来获得数据。
  • rule 属性
    • 该属性用于指定逻辑表要使用的规则名字,规则名字在 rule.xml 中定义,必须与 tableRule 标签中 name 属性属性值一一对应
  • autoIncrement 属性
    • mysql 对非自增长主键,使用 last_insert_id()是不会返回结果的,只会返回 0。所以,只有定义了自增长主键的表才可以用 last_insert_id()返回主键值。
    • mycat 目前提供了自增长主键功能,但是如果对应的 mysql 节点上数据表,没有定义 auto_increment,那么在 mycat 层调用 last_insert_id()也是不会返回结果的。
    • 由于 insert 操作的时候没有带入分片键,mycat 会先取下这个表对应的全局序列,然后赋值给分片键。这样才能正常的插入到数据库中,最后使用 last_insert_id()才会返回插入的分片键值。
    • 如果要使用这个功能最好配合使用数据库模式的全局序列。
    • 使用 autoIncrement=“true” 指定这个表有使用自增长主键,这样 mycat 才会不抛出分片键找不到的异常。
    • 使用 autoIncrement=“false” 来禁用这个功能,当然你也可以直接删除掉这个属性。默认就是禁用的。
  • subTables 属性
    • 使用方式添加 subTables="t_order$1-2,t_order3"。
    • 目前分表 1.6 以后开始支持 并且 dataNode 在分表条件下只能配置一个,分表条件下不支持各种条件的join 语句。
    • subTables就是填你要进行分表的表名,这里的“t_order”就是mysql数据库中的真是表。“t_order$1-2”可以看做“t_order1,t_order2”
  • 注意:mycat1.6(mycat2不清楚)要查询其他表的数据的话必须要配置才行,不配置的话,是找不到表的数据源的,如果是普通的表直接连接MySQL就可以了
 
 
2.3、dataNode 标签:
<dataNode name="dn1" dataHost="testphp" database="php" />
        dataNode 标签定义了 MyCat 中的数据节点,也就是我们通常说所的数据分片。一个 dataNode 标签就是一个独立的数据分片。
        例子中所表述的意思为:使用名字为 testphp 数据库实例上的 php 物理数据库,这就组成一个数据分片,最后,我们使用名字 dn1 标识这个分片。
 
  • dataHost 属性
    • 给数据库实例的一个命名,可以随意取。
    • 该属性用于定义该分片属于哪个数据库实例的,属性值是引用 dataHost 标签上定义的 name 属性。
  • name 属性
    • 定义数据节点的名字,这个名字需要是唯一的(名字随意),我们需要在 table 标签上应用这个名字,来建立表与分片对应的关系。
  • database 属性
    • 该属性用于定义该分片属性哪个具体数据库实例上的具体库(也就是mysql上具体的数据库名),因为这里使用两个纬度来定义分片,就是:实例+具体的库。因为每个库上建立的表和表结构是一样的。所以这样做就可以轻松的对表进行水平拆分。
 
 
2.4、dataHost 标签:
<dataHost name="testphp" maxCon="1000" minCon="10" balance="0" writeType="0" dbType="mysql" dbDriver="native" switchType="1"  slaveThreshold="100">
        作为 Schema.xml 中最后的一个标签,该标签在 mycat 逻辑库中也是作为最底层的标签存在,直接定义了具体的数据库实例、读写分离配置和心跳语句。
  • name 属性
    • 唯一标识 dataHost 标签,要与dataNode标签中的dataHost属性的值对应。
  • maxCon 属性
    • 指定每个读写实例连接池的最大连接。也就是说,标签内嵌套的 writeHost、readHost 标签都会使用这个属性的值来实例化出连接池的最大连接数。
  • minCon 属性
    • 指定每个读写实例连接池的最小连接,初始化连接池的大小。
  • balance 属性
    • 负载均衡类型,目前的取值有 3 种:
      • 1. balance="0", 不开启读写分离机制,所有读操作都发送到当前可用的 writeHost 上。
      • 2. balance="1",全部的 readHost 与 stand by writeHost 参与 select 语句的负载均衡,简单的说,当双
      • 主双从模式(M1->S1,M2->S2,并且 M1 与 M2 互为主备),正常情况下,M2,S1,S2 都参与 select 语句的负载均衡。
      • 3. balance="2",所有读操作都随机的在 writeHost、readhost 上分发。
      • 4. balance="3",所有读请求随机的分发到 wiriterHost 对应的 readhost 执行,writerHost 不负担读压力,
      • 注意 balance=3 只在 1.4 及其以后版本有,1.3 没有。
  • writeType 属性
    • 负载均衡类型,目前的取值有 3 种:
      • 1. writeType="0", 所有写操作发送到配置的第一个 writeHost,第一个挂了切到还生存的第二个 writeHost,重新启动后已切换后的为准,切换记录在配置文件中:dnindex.properties .
      • 2. writeType="1",所有写操作都随机的发送到配置的 writeHost,1.5 以后废弃不推荐。switchType 属性
        • -1 表示不自动切换。
        • 1 默认值,自动切换。
        • 2 基于 MySQL 主从同步的状态决定是否切换。
  • dbType 属性
    • 指定后端连接的数据库类型,目前支持二进制的 mysql 协议,还有其他使用 JDBC 连接的数据库。例如:mongodb、oracle、spark 等。
  • dbDriver 属性
    • 指定连接后端数据库使用的 Driver,目前可选的值有 native 和 JDBC。使用 native 的话,因为这个值执行的是二进制的 mysql 协议,所以可以使用 mysql 和 maridb。其他类型的数据库则需要使用 JDBC 驱动来支持。
    • 从 1.6 版本开始支持 postgresql 的 native 原始协议。
    • 如果使用 JDBC 的话需要将符合 JDBC 4 标准的驱动 JAR 包放到 MYCAT\lib 目录下,并检查驱动 JAR 包中包括如下目录结构的文件:META-INF\services\java.sql.Driver。在这个文件内写上具体的 Driver 类名,例如:com.mysql.jdbc.Driver。
  • switchType 属性
    • -1 表示不自动切换
    • 1 默认值,自动切换
    • 2 基于 MySQL 主从同步的状态决定是否切换
      • 心跳语句为 show slave status
    • 3 基于 MySQL galary cluster 的切换机制(适合集群)(1.4.1)
      • 心跳语句为 show status like ‘wsrep%’
  • slaveThreshold 属性
    • mysql主从的设置
 
 
2.5、writeHost 标签、readHost 标签:
<writeHost host="hostM1" url="127.0.0.1:3306" user="root" password="root">
<readHost host="hostS2" url="192.168.25.150:3306" user="root" password="root" />
        这两个标签都指定后端数据库的相关配置给 mycat,用于实例化后端连接池。唯一不同的是,writeHost 指定写实例、readHost 指定读实例,组着这些读写实例来满足系统的要求。
        在一个 dataHost 内可以定义多个 writeHost 和 readHost。但是,如果 writeHost 指定的后端数据库宕机,那么这个 writeHost 绑定的所有 readHost 都将不可用。另一方面,由于这个 writeHost 宕机系统会自动的检测到,并切换到备用的 writeHost 上去。
 
  • host 属性
    • 用于标识不同实例,一般 writeHost 我们使用*M1,readHost 我们用*S1。
    • 名字自定义
  • url 属性
    • 后端实例连接地址,如果是使用 native 的 dbDriver,则一般为 address:port 这种形式。用 JDBC 或其他的dbDriver,则需要特殊指定。当使用 JDBC 时则可以这么写:jdbc:mysql://localhost:3306/。
  • user 属性
    • 后端存储实例需要的用户名字。(真实数据库的帐号)
  • password 属性
    • 后端存储实例需要的密码。(真实数据库的密码)
  • weight 属性
    • 权重,配置在 readhost 中作为读节点的权重(1.4 以后)。
  • usingDecrypt 属性
    • 是否对密码加密,默认 0 否,如需要开启配置 1,同时使用加密程序对密码加密,加密命令为:执行 mycat jar 程序(1.4.1 以后):
 
3、rule.xml
3.1、配置文件图示:
        用vim命令打开rule.xml文件,内容如下图,因为内容太长我就不截全了,只截取不一样的地方和我自己需要的配置。
        
        
        
        
 
 
3.1、tableRule 标签
<tableRule name="mod-long">
    <rule>
        <columns>id</columns>
        <algorithm>mod-long</algorithm>
    </rule>
</tableRule>
        这个标签定义表规则。
 
  • name 属性
    • 指定唯一的名字,用于标识不同的表规则。与 schema.xml 文件中 table标签的rule属性相对应,表示使用哪个规则。
  • columns
    • columns 内指定要拆分的列名字
  • algorithm
    • algorithm 使用 function 标签中的 name 属性。连接表规则和具体路由算法。当然,多个表规则可以连接到同一个路由算法上。table 标签内使用。让逻辑表使用这个规则进行分片
 
3.2、function 标签
<function name="mod-long" class="io.mycat.route.function.PartitionByMod">
    <!-- how many data nodes -->
    <property name="count">3</property>
</function>
  • name 属性
    • 指定算法的名字
  • class
    • 制定路由算法具体的类名字
  • property
    • 为具体算法需要用到的一些属性
    • <property name="count">3</property>:我所用到的是这个算法,这个算法是取模(此规则为对分片字段求摸运算)
    • 这里的 “3”表示对“3”取模,也表示mysql数据库中有3个test表(本案例中我是对test表进行分表的)
    • name :表示算法名称,还有其他的算法名称,请自行查阅。
 
 
4、启动mycat
4.1、进入mycat安装目录下的bin目录
  • 我的目录地址是 /wwwroot/service/mycat/bin ;目录内容如下图
  • 图中有个“mycat”,它就是用来启动mycat的,支持如下命令:
    • mycat 支持的命令{ console | start | stop | restart | status }
    • “./mycat console”检测配置并启动,如果配置有问题会报错
    • “./mycat start”启动
    • “./mycat stop”停止
    • “./mycat restart”重启
    • “./mycat status”查看mycat状态
    • 其他命令请自行上网查询
 
 
5、测试
5.1、连接mycat
  • mysql -uroot -p -h127.0.0.1 -P8066 -TESTDB --default_auth=mysql_native_password
    • 像连接mysql一样连接mycat
    • -u:server.xml配置的用户名
    • -p:server.xml配置的密码
    • -h:数据库地址
    • -P(大写):mycat的端口
    • --default_auth:帐号的验证规则
  • 使用语句插入数据:
    • insert into test (id,title) values(300,'xiaoming'); 
    • insert into test (id,title) values(301,'xiaohong');
    • insert into test (id,title) values(302,'xiaolan');
 
 
 
 
 
posted @ 2022-05-09 17:11  疯子丶pony  阅读(878)  评论(0编辑  收藏  举报