本文的原文连接是: http://blog.csdn.net/freewebsys/article/details/47003577 未经博主同意不得转载。
1,业务需求
比方一个社交软件,比方像腾讯的qq。能够进行群聊天(gid),也能够单人聊天。
数据量按月添加须要按月进行数据库拆分。
比方依照2015年进行12个月拆分,同一时候能够配合gid进行水平拆分,也能够利用mysql分区。
mycat官方也推荐这样使用。这样能够添加单机单数据库的数据量。由于文件分开了。
关于mycat分区參考:
【 数据库垂直拆分,水平拆分利器。cobar升级版mycat】
http://blog.csdn.net/freewebsys/article/details/44046365
2,按月分表方案
首先将消息表拆分成12个月表。同一时候每个月表能够拆分成100个分区表。mysql分区运行起来灵活。按月分表能够随时间一直分下去,一次创建好一年的分表。基本上不须要数据迁移。
相比数据库的分区最大的优点就是能够跨多个数据库进行分区。能够做到吞吐量是单机的N倍。扩展性好。数据库能够是一个实体机器,也能够一个实体机器多个数据库,配置灵活。全然在mycat配置不须要client改动。
mysql数据库创建语句:
CREATE TABLE `msg` (
`id` bigint(20) NOT NULL,
`gid` bigint(20) DEFAULT NULL COMMENT '群id。mysql分区字段',
`content` varchar(4000),
`create_time` datetime DEFAULT NULL COMMENT '创建时间',
`create_date` int(8) DEFAULT NULL COMMENT '按月分表字段。不能为空。',
PRIMARY KEY (`id`,`gid`)
) ENGINE=MyISAM DEFAULT CHARSET=utf8
PARTITION BY KEY(`gid`)
PARTITIONS 100;
參考之前博客:
【Mycat 水平分表,垂直分表实践(2)】博客数据表拆分和全局id
http://blog.csdn.net/freewebsys/article/details/44399901
当中规则xml的配置例如以下:依照自然月进行分区。分区字段是create_date
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE mycat:rule SYSTEM "rule.dtd">
<mycat:rule xmlns:mycat="http://org.opencloudb/">
<!--msg 分区配置,依照自然月进行分区,分区字段是create_date-->
<tableRule name="sharding-by-month"> <rule>
<columns>create_date</columns>
<algorithm>sharding-by-month</algorithm> </rule>
</tableRule>
<function name="sharding-by-month" class="org.opencloudb.route.function.PartitionByMonth">
<property name="dateFormat">yyyyMMdd</property>
<property name="sBeginDate">20150101</property>
</function>
</mycat:rule>
schema.xml配置:
<?xml version="1.0"?>
<!DOCTYPE mycat:schema SYSTEM "schema.dtd">
<mycat:schema xmlns:mycat="http://org.opencloudb/">
<schema name="mycat" checkSQLschema="false" sqlMaxLimit="100">
<table name="MYCAT_SEQUENCE" primaryKey="name" type="global" dataNode="dataHost01" />
</schema>
<schema name="msg" checkSQLschema="false" sqlMaxLimit="100">
<table name="msg" primaryKey="create_date" dataNode="nodeMsg201501,nodeMsg201502,nodeMsg201503,nodeMsg201504" rule="sharding-by-month" />
</schema>
<!--依照月份进行拆分,一次做好一年的数据库。同一时候数据库中。能够依据实际情况在做mysql分区。-->
<dataNode name="nodeMsg201501" dataHost="dataHost01" database="msg_201501" />
<dataNode name="nodeMsg201502" dataHost="dataHost01" database="msg_201502" />
<dataNode name="nodeMsg201503" dataHost="dataHost01" database="msg_201503" />
<dataNode name="nodeMsg201504" dataHost="dataHost01" database="msg_201504" />
<!-- 能够一直按月分区下去。 -->
<dataHost name="dataHost01" maxCon="1000" minCon="10" balance="0"
writeType="0" dbType="mysql" dbDriver="native">
<heartbeat>select 1</heartbeat>
<writeHost host="hostM1" url="127.0.0.1:3306" user="root" password="root"/>
</dataHost>
</mycat:schema>
说明:这里按自然月分区须要使用1.4的版本号。里面包含规则类。或者把这个类复制到1.3的jar里面也行。
4,总结
本文的原文连接是: http://blog.csdn.net/freewebsys/article/details/47003577 未经博主同意不得转载。
使用mycat能够大大提高数据库的存储能力,对于每月自然增长的数据,按月存储是最好的办法。同一时候每个组使用自己的id自增策略,都从1開始计算,这样在查询历史数据的适合也按月进行迭代查询,当然全部牵扯到查询的sql都要改动,改动成按月进行查询。把日期參数传入。
数据库的扩展性增强了,能够支持数据持续增长的业务了。