代码改变世界

SQL Server 合并(删除)分区解惑

2010-11-05 16:33  听风吹雨  阅读(14586)  评论(9编辑  收藏  举报

一、准备

SQL Server 2005版本之后就有了表分区的概念与应用,在分区操作里面有一个叫做合并分区的功能,也被称为删除分区。分区所处的文件组和文件是不会被删除的,只会对数据进行转移合并。合并分区时需要注意所带来的IO问题。

合并分区常见情景:发现某个分区的数据很少,为了方便管理可以考虑合并分区。需要进行统计、四则运算的时候也可以考虑合并分区,这种情形下并没有对比合并与分区之间的性能,如果某位童鞋有兴趣和环境的话可以提供这方面的数据。

查看分区方案的方式:在SQL Server Management Studio中,选择数据库-->存储-->分区方案,右击分区方案名,在弹出的菜单中选择“编写分区方案脚本为”-->CREATE-->新查询编辑器窗口。

 

二、测试

(一)  环境:使用RANGE RIGHT作为分区函数的关键字,它表示这个值开始是属于右边界的。

RANGE RIGHT FOR VALUES ('20100101','20110101','20120101','20130101') 

文件组

分区

取值范围

[FG1]

1

[过去某年, 2010/01/01)

[FG2]

2

[2010/01/01, 2011/01/01)

[FG3]

3

[2011/01/01, 2012/01/01)

[FG4]

4

[2012/01/01, 2013/01/01)

[PRIMARY]

5

[2013/01/01, 未来某年)

1.     测试一:删除分区函数的第一个值

当使用MERGE RANGE ('20100101'),合并后分区就相当于:

RANGE RIGHT FOR VALUES ('20110101','20120101','20130101') 

文件组

分区

取值范围

[FG?]

1

[过去某年, 2011/01/01)

[FG3]

2

[2011/01/01, 2012/01/01)

[FG4]

3

[2012/01/01, 2013/01/01)

[PRIMARY]

4

[2013/01/01, 未来某年)

问题:是[FG1]合并到[FG2],还是[FG2]合并到[FG1]呢?

测试结果:[FG2]合并到[FG1]

2.     测试二:删除分区函数的第二个值

当使用MERGE RANGE ('20110101'),合并后分区就相当于:

RANGE RIGHT FOR VALUES ('20100101','20120101','20130101') 

文件组

分区

取值范围

[FG1]

1

[过去某年, 2010/01/01)

[FG?]

2

[2010/01/01, 2012/01/01)

[FG4]

3

[2012/01/01, 2013/01/01)

[PRIMARY]

4

[2013/01/01, 未来某年)

问题:是[FG2]合并到[FG3],还是[FG3]合并到[FG2]呢?

测试结果:[FG3]合并到[FG2]

3.     测试三:删除分区函数的最后一个值

当使用MERGE RANGE ('20130101'),合并后分区就相当于:

RANGE RIGHT FOR VALUES ('20100101','20110101','20120101')

文件组

分区

取值范围

[FG1]

1

[过去某年, 2010/01/01)

[FG2]

2

[2010/01/01, 2011/01/01)

[FG3]

3

[2011/01/01, 2012/01/01)

[?]

4

[2012/01/01, 未来某年)

问题:是[FG4]合并到[PRIMARY],还是[PRIMARY]合并到[FG4]呢?

测试结果:[PRIMARY]合并到[FG4]

 

(二)  环境:使用RANGE LEFT作为分区函数的关键字,它表示这个值开始是属于左边界的。

RANGE LEFT FOR VALUES ('20100101','20110101','20120101','20130101')

文件组

分区

取值范围

[FG1]

1

(过去某年, 2010/01/01]

[FG2]

2

(2010/01/01, 2011/01/01]

[FG3]

3

(2011/01/01, 2012/01/01]

[FG4]

4

(2012/01/01, 2013/01/01]

[PRIMARY]

5

(2013/01/01, 未来某年]

1.     测试四:删除分区函数的第一个值

当使用MERGE RANGE ('20100101'),合并后分区就相当于:

RANGE LEFT FOR VALUES ('20110101','20120101','20130101') 

文件组

分区

取值范围

[FG?]

1

(过去某年, 2011/01/01]

[FG3]

2

(2011/01/01, 2012/01/01]

[FG4]

3

(2012/01/01, 2013/01/01]

[PRIMARY]

4

(2013/01/01, 未来某年]

问题:是[FG1]合并到[FG2],还是[FG2]合并到[FG1]呢?

测试结果:[FG1]合并到[FG2]

2.     测试五:删除分区函数的第二个值

当使用MERGE RANGE ('20110101'),合并后分区就相当于:

RANGE LEFT FOR VALUES ('20100101','20120101','20130101') 

文件组

分区

取值范围

[FG1]

1

(过去某年, 2010/01/01]

[FG?]

2

(2010/01/01, 2012/01/01]

[FG4]

3

(2012/01/01, 2013/01/01]

[PRIMARY]

4

(2013/01/01, 未来某年]

问题:是[FG2]合并到[FG3],还是[FG3]合并到[FG2]呢?

测试结果:[FG2]合并到[FG3]

3.     测试六:删除分区函数的最后一个值

当使用MERGE RANGE ('20130101'),合并后分区就相当于:

RANGE LEFT FOR VALUES ('20100101','20110101','20120101') 

文件组

分区

取值范围

[FG1]

1

(过去某年, 2010/01/01]

[FG2]

2

(2010/01/01, 2011/01/01]

[FG3]

3

(2011/01/01, 2012/01/01]

[?]

4

(2012/01/01, 未来某年]

问题:是[FG4]合并到[PRIMARY],还是[PRIMARY]合并到[FG4]呢?

测试结果:[FG4]合并到[PRIMARY]

 

三、结论

下图中形象的表述了边界值(boundary_value)所处的分区,符号“()”表示不包含,“[]”表示包含,一个圆圈带叉图标表示需要删除这个边界值,当使用MERGE RANGE的时候,数据库就需要删除一个分区的数据,并把数据合并到另外一个分区中。你能从下图看出结论吗?


(图1:分区函数为右边界)


(图2:分区函数为左边界)

结论:删除的这个边界值(boundary_value)属于哪个分区,那么就会删除这个分区,再向邻近的分区合并。邻近的意思是以这个边界值为临界点的两个分区。图1与图2就很好的解释了这个结论。

 

四、参考文献

实战分区表:SQL Server 2k5&2k8系列(三)

SQL Server 2005中的分区表(四):删除(合并)一个分区

合并分区