解惑:对SQL Server分区进行合并(删除)

一、准备

在SQL Server 2005版本之后就有了表分区的概念与应用,在分区操作里面有一个叫做合并分区的功能,也被称为删除分区。分区所处的文件组和文件是不会被删除的,只会对数据进行转移合并。合并分区时需要注意所带来的IO问题。

合并分区常见情景:发现某个分区的数据很少,为了方便管理可以考虑合并分区。需要进行统计、四则运算的时候也可以考虑合并分区,这种情形下并没有对比合并与分区之间的性能,如果某位童鞋有兴趣和环境的话可以提供这方面的数据。

查看分区方案的方式:在SQL Server Management Studio中,选择数据库-->存储-->分区方案,右击分区方案名,在弹出的菜单中选择“编写分区方案脚本为”-->CREATE到-->新查询编辑器窗口。

二、测试

(一) 环境:使用RANGE RIGHT作为分区函数的关键字,它表示这个值开始是属于右边界的。

  1. RANGE RIGHT FOR VALUES ('20100101','20110101','20120101','20130101')  
文件组
分区
取值范围
[FG1]
1
[过去某年, 2010/01/01)
[FG2]
2
[2010/01/01, 2011/01/01)
[FG3]
3
[2011/01/01, 2012/01/01)
[FG4]
4
[2012/01/01, 2013/01/01)
[PRIMARY]
5
[2013/01/01, 未来某年)

1.   测试一:删除分区函数的第一个值

当使用MERGE RANGE ('20100101'),合并后分区就相当于:

  1. RANGE RIGHT FOR VALUES ('20110101','20120101','20130101')   
文件组
分区
取值范围
[FG?]
1
[过去某年, 2011/01/01)
[FG3]
2
[2011/01/01, 2012/01/01)
[FG4]
3
[2012/01/01, 2013/01/01)
[PRIMARY]
4
[2013/01/01, 未来某年)

 

问题:是[FG1]合并到[FG2],还是[FG2]合并到[FG1]呢?

测试结果:[FG2]合并到[FG1]

2. 测试二:删除分区函数的第二个值

当使用MERGE RANGE ('20110101'),合并后分区就相当于:

  1. RANGE RIGHT FOR VALUES ('20100101','20120101','20130101'
文件组
分区
取值范围
[FG1]
1
[过去某年, 2010/01/01)
[FG?]
2
[2010/01/01, 2012/01/01)
[FG4]
3
[2012/01/01, 2013/01/01)
[PRIMARY]
4
[2013/01/01, 未来某年)

问题:是[FG2]合并到[FG3],还是[FG3]合并到[FG2]呢?

测试结果:[FG3]合并到[FG2]

 

3.     测试三:删除分区函数的最后一个值

当使用MERGE RANGE ('20130101'),合并后分区就相当于:

  1. RANGE RIGHT FOR VALUES ('20100101','20110101','20120101'
文件组
分区
取值范围
[FG1]
1
[过去某年, 2010/01/01)
[FG2]
2
[2010/01/01, 2011/01/01)
[FG3]
3
[2011/01/01, 2012/01/01)
[?]
4
[2012/01/01, 未来某年)

问题:是[FG4]合并到[PRIMARY],还是[PRIMARY]合并到[FG4]呢?

测试结果:[PRIMARY]合并到[FG4]

(二) 环境:使用RANGE LEFT作为分区函数的关键字,它表示这个值开始是属于左边界的。

  1. RANGE LEFT FOR VALUES ('20100101','20110101','20120101','20130101'
文件组
分区
取值范围
[FG1]
1
(过去某年, 2010/01/01]
[FG2]
2
(2010/01/01, 2011/01/01]
[FG3]
3
(2011/01/01, 2012/01/01]
[FG4]
4
(2012/01/01, 2013/01/01]
[PRIMARY]
5
(2013/01/01, 未来某年]

1.  测试四:删除分区函数的第一个值

当使用MERGE RANGE ('20100101'),合并后分区就相当于:

  1. RANGE LEFT FOR VALUES ('20110101','20120101','20130101')  
文件组
分区
取值范围
[FG?]
1
(过去某年, 2011/01/01]
[FG3]
2
(2011/01/01, 2012/01/01]
[FG4]
3
(2012/01/01, 2013/01/01]
[PRIMARY]
4
(2013/01/01, 未来某年]

问题:是[FG1]合并到[FG2],还是[FG2]合并到[FG1]呢?

测试结果:[FG1]合并到[FG2]

2.     测试五:删除分区函数的第二个值

当使用MERGE RANGE ('20110101'),合并后分区就相当于:

  1. RANGE LEFT FOR VALUES ('20100101','20120101','20130101')  
文件组
分区
取值范围
[FG1]
1
(过去某年, 2010/01/01]
[FG?]
2
(2010/01/01, 2012/01/01]
[FG4]
3
(2012/01/01, 2013/01/01]
[PRIMARY]
4
(2013/01/01, 未来某年]

问题:是[FG2]合并到[FG3],还是[FG3]合并到[FG2]呢?

测试结果:[FG2]合并到[FG3]

3.    测试六:删除分区函数的最后一个值

当使用MERGE RANGE ('20130101'),合并后分区就相当于:

  1. RANGE LEFT FOR VALUES ('20100101','20110101','20120101')  
文件组
分区
取值范围
[FG1]
1
(过去某年, 2010/01/01]
[FG2]
2
(2010/01/01, 2011/01/01]
[FG3]
3
(2011/01/01, 2012/01/01]
[?]
4
(2012/01/01, 未来某年]

问题:是[FG4]合并到[PRIMARY],还是[PRIMARY]合并到[FG4]呢?

测试结果:[FG4]合并到[PRIMARY]

三、结论

下图中形象的表述了边界值(boundary_value)所处的分区,符号“()”表示不包含,“[]”表示包含,一个圆圈带叉图标表示需要删除这个边界值,当使用MERGE RANGE的时候,数据库就需要删除一个分区的数据,并把数据合并到另外一个分区中。你能从下图看出结论吗?

 

(图1:分区函数为右边界)

 

(图2:分区函数为左边界)

结论:删除的这个边界值(boundary_value)属于哪个分区,那么就会删除这个分区,再向邻近的分区合并。邻近的意思是以这个边界值为临界点的两个分区。图1与图2就很好的解释了这个结论。

posted @ 2012-03-07 13:44  Alex Tian  阅读(347)  评论(0编辑  收藏  举报