表分区

使用分区可以快速而有效地管理和访问数据子集，

例如，如果对当前月份的数据主要执行 INSERT、UPDATE、DELETE 和 MERGE 操作，而对以前月份的数据主要执行 SELECT 查询，则按月份对表进行分区可能会使表的管理工作更容易一些。如果对表的常规维护操作只针对一个数据子集，那么此优点尤为明显。如果该表没有分区，那么就需要对整个数据集执行这些操作，这样就会消耗大量资源。例如，通过分区，可以针对具有只写数据的单个月份执行类似索引重新生成和碎片整理的维护操作，而只读数据仍可用于联机访问。

在 SQL Server 中，数据库中的所有表和索引都视为已分区表和索引，即使这些表和索引只包含一个分区。实际上，分区构成了表和索引的物理结构中的基本组织单位。

SQL Server 2005引入的表分区技术，让用户能够把数据分散存放到不同的物理磁盘中，提高这些磁盘的并行处理性能以优化查询性能。

　　SQL Server数据库表分区操作过程由三个步骤组成：

　　1. 创建分区函数

　　2. 创建分区架构

　　3. 对表进行分区

　　下面将对每个步骤进行详细介绍。

　　步骤一：创建一个分区函数

　　此分区函数用于定义你希望SQL Server如何对数据进行分区的参数值([u]how[/u])。这个操作并不涉及任何表格，只是单纯的定义了一项技术来分割数据。

　　我们可以通过指定每个分区的边界条件来定义分区。例如，假定我们有一份Customers表，其中包含了关于所有客户的信息，以一一对应的客户编号(从1到1,000,000)来区分。我们将通过以下的分区函数把这个表分为四个大小相同的分区：　　

CREATE PARTITION FUNCTION customer_partfunc (int)
　　AS RANGE RIGHT
　　FOR VALUES (250000, 500000, 750000)

　　这些边界值定义了四个分区。第一个分区包括所有值小于250,000的数据，第二个分区包括值在250,000到49,999之间的数据。第三个分区包括值在500,000到7499,999之间的数据。所有值大于或等于750,000的数据被归入第四个分区。

　　请注意，这里调用的"RANGE RIGHT"语句表明每个分区边界值是右界。类似的，如果使用"RANGE LEFT"语句，则上述第一个分区应该包括所有值小于或等于250,000的数据，第二个分区的数据值在250,001到500,000之间，以此类推。

　　步骤二：创建一个分区架构

　　一旦给出描述如何分割数据的分区函数，接着就要创建一个分区架构，用来定义分区位置([u]where[/u])。创建过程非常直截了当，只要将分区连接到指定的文件组就行了。例如，如果有四个文件组，组名从"fg1"到"fg4"，那么以下的分区架构就能达到想要的效果：　　

CREATE PARTITION SCHEME customer_partscheme
　　AS PARTITION customer_partfunc
　　TO (fg1, fg2, fg3, fg4)

　　注意，这里将一个分区函数连接到了该分区架构，但并没有将分区架构连接到任何数据表。这就是可复用性起作用的地方了。无论有多少数据库表，我们都可以使用该分区架构(或仅仅是分区函数)。

　　步骤三：对一个表进行分区

　　定义好一个分区架构后，就可以着手创建一个分区表了。这是整个分区操作过程中最简单的一个步骤。只需要在表创建指令中添加一个"ON"语句，用来指定分区架构以及应用该架构的表列。因为分区架构已经识别了分区函数，所以不需要再指定分区函数了。

　　例如，使用以上的分区架构创建一个客户表，可以调用以下的Transact-SQL指令：　　

CREATE TABLE customers (FirstName nvarchar(40), LastName nvarchar(40), CustomerNumber int)
　　ON customer_partscheme (CustomerNumber)

　　关于SQL Server的表分区功能，你知道上述的相关知识就足够了。记住!编写能够用于多个表的一般的分区函数和分区架构就能够大大提高可复用性。

----------------------------------------------------------------------------------------------------------------------------

-- 增加文件组
Alter DataBase TEST ADD FILEGROUP [User01]
ALTER DATABASE TEST
   ADD FILE
(NAME = 'User01',
   FILENAME = 'D:\SqlData\UserFS01.NDF',
   SIZE = 5MB,
   FILEGROWTH = 5MB)
   TO FILEGROUP User01

Alter DataBase TEST ADD FILEGROUP [User02]
ALTER DATABASE TEST
   ADD FILE
(NAME = 'User02',
   FILENAME = 'D:\SqlData\UserFS02.NDF',
   SIZE = 5MB,
   FILEGROWTH = 5MB)
   TO FILEGROUP User02

-- 增加分区范围
CREATE PARTITION FUNCTION [UserRange]
(int) AS RANGE RIGHT FOR VALUES
(1000,1100)
go

-- 增加分区架构
CREATE PARTITION SCHEME [UserScheme]
AS PARTITION [UserRange]
TO ([User01], [User02],[PRIMARY])

-- 删除一个点
ALTER PARTITION FUNCTION
[UserRange]()
MERGE RANGE ('1100')

-- 在最后增加一个文件组
ALTER PARTITION SCHEME [UserScheme124]
NEXT USED [User03]
GO

-- 增加一个点
ALTER PARTITION FUNCTION
[UserRange]()
SPLIT RANGE ('1200')
GO

-- 查找一条记录在那个分区
select $partition.[UserRange](id),userid FROM usertable where userid = 1000120
SELECT *, $PARTITION.[Data Partition Range](ID) FROM MyTable

本文演示了 SQL Server 2005 分区表分区切换的三种形式： 1. 切换分区表的一个分区到普通数据表中：Partition to Table； 2. 切换普通表数据到分区表的一个分区中：Table to Partition； 3. 切换分区表的分区到另一分区表：Partition to Partition。并指出了在分区表分区切换过程中的注意事项。

-- 创建分区函数
create partition function PF_Orders_OrderDateRange(datetime)
as
range right for values (
'1997-01-01',
'1998-01-01',
'1999-01-01'
)
go
-- 创建分区方案
create partition scheme PS_Orders
as
partition PF_Orders_OrderDateRange
to ([primary], [primary], [primary], [primary])
go
-- 创建分区表
create table dbo.Orders
(
OrderID     int          not null
,CustomerID  varchar(10)  not null
,EmployeeID  int          not null
,OrderDate   datetime     not null
)
on PS_Orders(OrderDate)
go
-- 创建聚集分区索引
create clustered index IXC_Orders_OrderDate on dbo.Orders(OrderDate)
go
-- 为分区表设置主键
alter table dbo.Orders add constraint PK_Orders
primary key (OrderID, CustomerID, OrderDate)
go
-- 导入数据到分区表
insert into dbo.Orders
select OrderID, CustomerID, EmployeeID, OrderDate
from dbo.Orders_From_SQL2000_Northwind   --（注：数据来源于 SQL Server 2000 示例数据库）
go
-- 查看分区表每个分区的数据分布情况
select partition = $partition.PF_Orders_OrderDateRange(OrderDate)
,rows      = count(*)
,minval    = min(OrderDate)
,maxval    = max(OrderDate)
from dbo.Orders
group by $partition.PF_Orders_OrderDateRange(OrderDate)
order by partition
go

一、切换分区表的一个分区到普通数据表中：Partition to Table

首先建立普通数据表 Orders_1998，该表用来存放订单日期为 1998 年的所有数据。

create table dbo.Orders_1998
(
OrderID     int          not null
,CustomerID  varchar(10)  not null
,EmployeeID  int          not null
,OrderDate   datetime     not null
) on [primary]
go
create clustered index IXC_Orders1998_OrderDate on dbo.Orders_1998(OrderDate)
go
alter table dbo.Orders_1998 add constraint PK_Orders_1998
primary key nonclustered (OrderID, CustomerID, OrderDate)
go

开始切换分区表 Orders 第三个分区的数据（1998年的数据）到普通表 Orders_1998

   alter table dbo.Orders switch partition 3 to dbo.Orders_1998

值得注意的是，如果你想顺利地进行分区到普通表的切换，最好满足以下的前提条件： 1. 普通表必须建立在分区表切换分区所在的文件组上。 2. 普通表的表结构跟分区表的一致； 3. 普通表上的索引要跟分区表一致。 4. 普通表必须是空表，不能有任何数据。

二、切换普通表数据到分区表的一个分区中：Table to Partition

上面我们已经把分区表 Orders 第三个分区的数据切换到普通表 Orders_1998 中了，现在我们再切换回来：

   alter table dbo.Orders_1998 switch to dbo.Orders partition 3

但是，此时有错误发生：

Msg 4982, Level 16, State 1, Line 1
ALTER TABLE SWITCH statement failed.
Check constraints of source table 'Sales.dbo.Orders_1998' allow values
that are not allowed by range defined by partition 3 on target table 'Sales.dbo.Orders'.

这就奇怪了，能把数据从分区切换进来却切换不出去。出错信息中提示我们是普通表的 check constraint 跟分区表不一致。于是在普通表上建立 check constraint：

   alter table dbo.Orders_1998 add constraint CK_Orders1998_OrderDate
check (OrderDate>='1998-01-01' and OrderDate<'1999-01-01')

再次进行切换，成功！

看来，切换普通表数据到分区，除了满足上面的 4 个条件外，还要加上一条：普通表必须加上和分区数据范围一致的 check 约束条件。

三、切换分区表的分区到另一分区表：Partition to Partition

首先建立分区表 OrdersArchive，这个表用来存放订单历史数据。

-- 创建分区函数
create partition function PF_OrdersArchive_OrderDateRange(datetime)
as
range right for values (
'1997-01-01',
'1998-01-01',
'1999-01-01'
)
go
-- 创建分区方案
create partition scheme PS_OrdersArchive
as
partition PF_OrdersArchive_OrderDateRange
to ([primary], [primary], [primary], [primary])
go
-- 创建分区表
create table dbo.OrdersArchive
(
OrderID     int          not null
,CustomerID  varchar(10)  not null
,EmployeeID  int          not null
,OrderDate   datetime     not null
)
on PS_OrdersArchive(OrderDate)
go
-- 创建聚集分区索引
create clustered index IXC_OrdersArchive_OrderDate on dbo.OrdersArchive(OrderDate)
go
-- 为分区表设置主键
alter table dbo.OrdersArchive add constraint PK_OrdersArchive
primary key (OrderID, CustomerID, OrderDate)
go

然后，切换分区表 Orders 分区数据到 OrdersArchive 分区：

   alter table dbo.Orders switch partition 1  to dbo.OrdersArchive partition 1
alter table dbo.Orders switch partition 2  to dbo.OrdersArchive partition 2
alter table dbo.Orders switch partition 3  to dbo.OrdersArchive partition 3

最后，查看分区表 OrdersArchive 各分区数据分布情况：

-- 查看分区表每个分区的数据分布情况
select partition = $partition.PF_OrdersArchive_OrderDateRange(OrderDate)
,rows      = count(*)
,minval    = min(OrderDate)
,maxval    = max(OrderDate)
from dbo.OrdersArchive
group by $partition.PF_OrdersArchive_OrderDateRange(OrderDate)
order by partition

实际上，分区表分区切换并没有真正去移动数据，而是 SQL Server 在系统底层改变了表的元数据。因此分区表分区切换是高效、快速、灵活的。利用分区表的分区切换功能，我们可以快速加载数据到分区表。卸载分区数据到普通表，然后 truncate 普通表，以实现快速删除分区表数据。快速归档不活跃数据到历史表。

Posted on 2008-12-23 16:50 Yongming Ye 阅读(429) 评论(0) 编辑收藏举报

刷新页面返回顶部

Ming's Blog

表分区

一、切换分区表的一个分区到普通数据表中：Partition to Table

二、切换普通表数据到分区表的一个分区中：Table to Partition

三、切换分区表的分区到另一分区表：Partition to Partition