参考:https://blog.csdn.net/qq_26664043/article/details/138452285
存储了百万级乃至千万级条记录的表过于庞大,导致数据库在查询和插入的时候耗时太长,性能低下,如果涉及联合查询的情况,性能会更加糟糕。

分表和表分区的目的就是减少数据库的负担,提高数据库的效率,通常点来讲就是提高表的增删改查效率。

分区是将数据分段划分在多个位置存放,可以是同一块磁盘也可以在不同的机器。分区后,表面上还是一张表,但数据散列到多个位置了。程序读写的时候操作的还是大表名字,db自动去组织分区的数据。

分区的方式:Range、List、Hash、Key

Range分区

-- RANGE 分区
-- 删除p0分区
-- ALTER TABLE td_vipexchangecodeinfo DROP PARTITION p0;

DROP TABLE IF EXISTS `td_vipexchangecodeinfo`;
CREATE TABLE IF NOT EXISTS `td_vipexchangecodeinfo` (
  `ID` int(11) NOT NULL AUTO_INCREMENT,
  `CardNo` varchar(200) DEFAULT NULL,
  `ChannelID` int(11) DEFAULT NULL,
  `Status` int(11) DEFAULT NULL,
  `ManagerID` int(11) DEFAULT NULL,
  `CreateDate` datetime DEFAULT NULL,
  PRIMARY KEY (`ID`)
) ENGINE = MyISAM AUTO_INCREMENT=1 DEFAULT CHARSET=utf8
PARTITION BY RANGE(`ID`)
(
PARTITION p0 VALUES LESS THAN (500000),
PARTITION p1 VALUES LESS THAN (1000000),
PARTITION p2 VALUES LESS THAN (1500000)
PARTITION p6 VALUES LESS THAN MAXVALUE
ENGINE = MyISAM 
);

根据TIMESTAMP范围分区:

...
PARTITION BY RANGE(unix_timestamp(CreateDate))
(
  partition p0 values less than (unix_timestamp('2022-01-01 00:00:00')),
  partition p1 values less than (unix_timestamp('2023-01-01 00:00:00')),
  partition p2 values less than (unix_timestamp('2024-01-01 00:00:00')),
  partition p3 values less than maxvalue
);

添加COLUMNS关键字可定义非integer范围及多列范围,不过需要注意COLUMNS括号内只能是列名,不支持函数;多列范围时,多列范围必须呈递增趋势:

...
PARTITION BY RANGE COLUMNS(CreateDate)
(
  partition p0 values less than ('2022-01-01 00:00:00'),
  partition p1 values less than ('2023-01-01 00:00:00'),
  partition p2 values less than ('2024-01-01 00:00:00'),
  partition p3 values less than maxvalue
);

多列:

...
partition by range columns(a,b)
(
  partition p0 values less than (0,10),
  partition p1 values less than (10,20),
  partition p2 values less than (maxvalue,maxvalue)
)


List分区

DROP TABLE IF EXISTS tb_list;
CREATE TABLE IF NOT EXISTS tb_list( 
ID INT(11) NOT NULL AUTO_INCREMENT,
Age INT(11),
PRIMARY KEY(`ID`)
)ENGINE=MyISAM AUTO_INCREMENT=1 DEFAULT CHARSET=utf8
PARTITION BY LIST(ID)
(
    PARTITION p0 values in (1,3,5,7,9), 
    PARTITION p1 values in (2,4,6,8,10) 
);

 

HASH分区:

基于用户定义的表达式的返回值来进行选择的分区,该表达式使用将要插入到表中的这些行的列值进行计算。这个函数可以包含MySQL 中有效的、产生非负整数值的任何表达式。
HASH分区主要用来确保数据在预先确定数目的分区中平均分布。在RANGE和LIST分区中,必须明确指定一个给定的列值或列值集合应该保存在哪个分区中;而在HASH分区中,MySQL 自动完成这些工作,你所要做的只是基于将要被哈希的列值指定一个列值或表达式,以及指定被分区的表将要被分割成的分区数量。
要使用HASH分区来分割一个表,要在CREATE TABLE 语句上添加一个“PARTITION BY HASH (expr)”子句,其中“expr”是一个返回一个整数的表达式。它可以仅仅是字段类型为MySQL 整型的一列的名字。此外,你很可能需要在后面再添加一个“PARTITIONS num”子句,其中num 是一个非负的整数,它表示表将要被分割成分区的数量。如果没有包括一个PARTITIONS子句,那么分区的数量将默认为1。

DROP TABLE IF EXISTS `p_hash`;
CREATE TABLE `p_hash` (
`id` int(10) NOT NULL AUTO_INCREMENT,
`storeid` mediumint(10) NOT NULL DEFAULT '0',
`storename` char(255) DEFAULT NULL,
PRIMARY KEY (`id`,`storeid`)
) ENGINE=InnoDB AUTO_INCREMENT=11 DEFAULT CHARSET=utf8
/*PARTITION BY HASH (storeid)
PARTITIONS 4 */;

 

Key分区

DROP TABLE IF EXISTS `p_key`;
CREATE TABLE `p_key` (
`id` int(10) NOT NULL AUTO_INCREMENT,
`keyname` char(20) DEFAULT NULL,
`keyval` varchar(1000) DEFAULT NULL,
PRIMARY KEY (`id`)
) ENGINE=MyISAM AUTO_INCREMENT=12 DEFAULT CHARSET=utf8
/* PARTITION BY KEY (id)
PARTITIONS 4 */;

 

range与list分区的管理
删除分区
ALTER TABLE tr DROP PARTITION p1;
需要注意的是删除分区后,该分区的所有数据都没有了。同时删除后存在一个重大影响也就是typeid为5,6,7,8的记录是不能写入到该表了的!
清空数据
如果想要保留表结构与分区结构可以使用 TRUNCATE TABLE 清空表
更改分区保留数据
ALTER TABLE tbl_name REORGANIZE PARTITION partition_list INTO (partition_definitions);

-- 在现有表上创建分区,不会丢失数据
ALTER TABLE loginlog PARTITION BY RANGE (Id)
(   
PARTITION p_0 VALUES LESS THAN (5),
PARTITION p_1 VALUES LESS THAN (10), 
PARTITION p_2 VALUES LESS THAN (15), 
PARTITION p_3 VALUES LESS THAN MAXVALUE 
);

-- 拆分表分区,不会丢失数据
ALTER TABLE loginlog REORGANIZE PARTITION s_0 INTO (
 PARTITION p_0 VALUES LESS THAN (5),
 PARTITION p_1 VALUES LESS THAN (10)
);

-- 合并表分区,不会丢失数据
ALTER TABLE loginlog REORGANIZE PARTITION p_0,p_1 INTO (
 PARTITION s_0 VALUES LESS THAN (10)
); 

使用 REORGANIZE PARTITION进行数据的合并与拆分,数据是没有丢失的。

在使用REORGANIZE进行重新分区时,需要注意几点:
1、用来确定新分区模式的PARTITION子句使用与用在CREATE TABLE中确定分区模式的PARTITION子句相同的规则。(partition 分区子句必须与创建原分区时的规则相同)
2、partition_definitions 列表中分区的合集应该与在partition_list 中命名分区的合集占有相同的区间或值集合。 (不管是合并还是拆分,s0,s1到p0;p0到s0,s1 里面的区间或者值都必须相同)
3、对于按照RANGE分区的表,只能重新组织相邻的分区;不能跳过RANGE分区。(比如按range年份 p0 1990,p1 2000 ,p2 2013三个分区;在合并时partition p0,p2 into()
   这样是不行的,因为这两个分区不是相邻的分区;)
4、不能使用REORGANIZE PARTITION来改变表的分区类型;也就是说,例如,不能把RANGE分区变为HASH分区,反之亦然。也不能使用该命令来改变分区表达式或列。
增加分区
ALTER TABLE p_list ADD PARTITION (PARTITION p2 VALUES IN (9, 10, 11));
但是不能使用
ALTER TABLE p_list ADD PARTITION (PARTITION p2 VALUES IN (9, 14));
这样mysql 会产生错误1465 (HY000): 在LIST分区中,同一个常数的多次定义
hash与key分区的管理在改变分区设置方面,按照HASH分区或KEY分区的表彼此非常相似,但是它们又与按照RANGE或LIST分区的表在很多方面有差别。
关于添加和删除按照RANGE或LIST进行分区的表的分区
不能使用与从按照RANGE或LIST分区的表中删除分区相同的方式,来从HASH或KEY分区的表中删除分区。但是,可以使用“ALTER TABLE ... COALESCE PARTITION”命令来合并HASH或KEY分区。
查看源代码打印帮助1 DROP TABLE IF EXISTS `p_hash`;  2    3 CREATE TABLE `p_hash` (  4 `id` int(10) NOT NULL AUTO_INCREMENT,  5 `storeid` mediumint(10) NOT NULL DEFAULT '0',  6 `storename` char(255) DEFAULT NULL,  7 PRIMARY KEY (`id`,`storeid`)  8 ) ENGINE=InnoDB AUTO_INCREMENT=11 DEFAULT CHARSET=utf8  9 /*!50100 PARTITION BY HASH (storeid)  10 PARTITIONS 4 */; 
如p_hash的分区数为4个;
要减少分区数为2个
ALTER TABLE p_hash COALESCE PARTITION 2;
对于按照HASH,KEY,LINEAR HASH,或LINEAR KEY分区的表, COALESCE能起到同样的作用。COALESCE不能用来增加分区的数量,如果你尝试这么做,结果会出现类似于下面的错误:
mysql> ALTER TABLE clients COALESCE PARTITION 18;
错误1478 (HY000): 不能移动所有分区,使用DROP TABLE代替要增加顾客表的分区数量从12到18,使用“ALTER TABLE … ADD PARTITION”,具体如下:
ALTER TABLE clients ADD PARTITION PARTITIONS 18;注释:“ALTER TABLE … REORGANIZE PARTITION”不能用于按照HASH或HASH分区的表。
分区维护
重建分区
这和先删除保存在分区中的所有记录,然后重新插入它们,具有同样的效果。它可用于整理分区碎片。
ALTER TABLE t1 REBUILD PARTITION (p0, p1);
优化分区如果从分区中删除了大量的行,或者对一个带有可变长度的行(也就是说,有VARCHAR,BLOB,或TEXT类型的列)作了许多修改,
可以使用“ALTER TABLE … OPTIMIZE PARTITION”来收回没有使用的空间,并整理分区数据文件的碎片。
ALTER TABLE t1 OPTIMIZE PARTITION (p0, p1);
分析分区
读取并保存分区的键分布
ALTER TABLE t1 ANALYZE PARTITION (p3);
修补分区: 修补被破坏的分区。
ALTER TABLE t1 REPAIR PARTITION (p0,p1);
检查分区
可以使用几乎与对非分区表使用CHECK TABLE 相同的方式检查分区。
ALTER TABLE trb3 CHECK PARTITION (p1);
这个命令可以告诉你表t1的分区p1中的数据或索引是否已经被破坏。如果发生了这种情况,使用“ALTER TABLE ... REPAIR PARTITION”来修补该分区。获取分区信息
在mysql服务器信息数据库里面的partitions存放着服务器所有表的分区信息。

代码如下:

explain partitions命令
explain partitions select * from p_hash
+----+-------------+--------+-------------+------+---------------+------+---------+------+------+-------+
| id | select_type | table  | partitions  | type | possible_keys | key  | key_len | ref  | rows | Extra |
+----+-------------+--------+-------------+------+---------------+------+---------+------+------+-------+
|  1 | SIMPLE    | p_hash | p0,p1,p2,p3 | ALL  | NULL      | NULL | NULL   | NULL |  10 |    |
+----+-------------+--------+-------------+------+---------------+------+---------+------+------+-------+


-- 获取到p_list表的分区详细信息。
select * from information_schema.`PARTITIONS` where TABLE_NAME = 'p_list';
-- 分区的创建信息
show create table p_list;

更多参考:

http://www.jb51.net/article/42544.htm
http://blog.csdn.net/orangleliu/article/details/57088338

posted on 2017-08-30 16:12  邢帅杰  阅读(247)  评论(0编辑  收藏  举报