SQL Server 2005/2008/2012中应用分布式分区视图

SQL Server 2008中SQL应用系列--目录索引

  自2000版本起,SQL Server企业版中引入分布式分区视图,允许你为分布在不同的SQL 实例的两个或多个水平分区表创建视图。

  简要步骤如下:根据Check约束中定义的一组值把大表分割成更小的一些表。Check约束确保每个小表保存着不能保存在其他表的唯一数据。然后使用Union All创建分布式分区视图,把所有这些小表联结成单独的结果集。

  这样对性能的改善是有益的,例如,如果视图根据日期分区,并用查询来返回仅保存在一个分区表中的行,那么SQL Server会智能地只搜索一个分区而不是分布式分区视图中的所有表。

  我们假设一个场景,某公司成立上海和北京分公司,分别有各自的SQL Server实例来保存网站数据,都希望用一个表跟踪网站点击。点击量非常大。此时,需要一个视图以在单个视图中引用各自的表。公司希望能查询任意一个服务器,并且返回相同的数据或各自分公司的数据。

  下面我们通过实例来演示这个场景的具体应用。假定有两个实例:AP4\NET2012和AP4\NET2013(本文所有示例均在SQL Server 2008环境下通过)。

一、创建链接服务器,当然也可以通过OpenRowset(http://msdn.microsoft.com/zh-cn/library/ms190312.aspx)而不创建链接服务器,并创建测试数据库和表。

/********* 创建一个分布式分区视图 ***************/
/********* 3w@live.cn 邀月 ***************/

USE master
GO
EXEC sp_addlinkedserver
'AP4\NET2013',
N'SQL Server'
GO

-- 跳过远程实例架构表的检查,以提升性能,邀月注
EXEC sp_serveroption 'AP4\NET2013', 'lazy schema validation', 'true'
GO

--创建测试数据库
IF NOT EXISTS (SELECT name
FROM sys.databases
WHERE name = 'RemoteViewTest2012')
BEGIN
CREATE DATABASE RemoteViewTest2012
END
GO
--打开测试库
Use RemoteViewTest2012
GO

--创建上海分公司的点击表
CREATE TABLE dbo.WebHits_ShangHai
(WebHitID uniqueidentifier NOT NULL,
WebSite varchar(20) NOT NULL ,
HitDT datetime NOT NULL,
CHECK (WebSite = 'ShangHai'),
CONSTRAINT PK_WebHits PRIMARY KEY (WebHitID, WebSite))

 

 

第二个实例:

/*************** 实例 AP4\NET2013(SQL Server 2008) *********/
/********* 3w@live.cn 邀月 ***************/
USE master
GO
EXEC sp_addlinkedserver
'AP4\NET2012',
N'SQL Server'
GO

-- 跳过远程实例架构表的检查,以提升性能,邀月注
EXEC sp_serveroption 'AP4\NET2012', 'lazy schema validation', 'true'
GO

IF NOT EXISTS (SELECT name
FROM sys.databases
WHERE name = 'RemoteViewTest2012')
BEGIN
CREATE DATABASE RemoteViewTest2012
END
GO

--打开测试库
Use RemoteViewTest2012
GO

--创建北京分公司的点击表
CREATE TABLE dbo.WebHits_BeiJing
(WebHitID uniqueidentifier NOT NULL,
WebSite varchar(20) NOT NULL ,
HitDT datetime NOT NULL,
CHECK (WebSite = 'BeiJing'),
CONSTRAINT PK_WebHits PRIMARY KEY (WebHitID, WebSite))

 

二、在两个实例中分别创建视图

/*************** 实例 AP4\NET2012(SQL Server 2008) *********/
/********* 3w@live.cn 邀月 ***************/

--打开测试库
Use RemoteViewTest2012
GO

--创建分区视图
CREATE VIEW dbo.v_WebHits AS
SELECT WebHitID,
WebSite,
HitDT
FROM RemoteViewTest2012.dbo.WebHits_ShangHai
UNION ALL
SELECT WebHitID,
WebSite,
HitDT
FROM [AP4\NET2013].RemoteViewTest2012.dbo.WebHits_BeiJing
GO

/*************** 实例 AP4\NET2013(SQL Server 2008) *********/
/********* 3w@live.cn 邀月 ***************/

--打开测试库
Use RemoteViewTest2012
GO

--创建分区视图
CREATE VIEW dbo.v_WebHits AS
SELECT WebHitID,
WebSite,
HitDT
FROM RemoteViewTest2012.dbo.WebHits_BeiJing
UNION ALL
SELECT WebHitID,
WebSite,
HitDT
FROM [AP4\NET2012].RemoteViewTest2012.dbo.WebHits_ShangHai
GO

 

三、插入测试数据

我们可以选择任意一个实例中插入,下面我们选择AP4\NET2013

/*************** 实例 AP4\NET2013(SQL Server 2008) *********/
/********* 3w@live.cn 邀月 ***************/
----要保证插入,必须打开XACT_ABORT开关,并开启分布式事务协调器,邀月注

--打开测试库
Use RemoteViewTest2012
GO

SET XACT_ABORT ON
INSERT dbo.v_WebHits
(WebHitID, WebSite, HitDT)
VALUES(NEWID(), 'ShangHai', GETDATE())

INSERT dbo.v_WebHits
(WebHitID, WebSite, HitDT)
VALUES(NEWID(), 'BeiJing', GETDATE())

 

  注意,如果该实例所在的服务器上没有启用MSDTC(Microsoft 分布式事务处理协调器),会抛出一个错误:

邀月工作室

  此时在命令行中输入Net start msdtc以启用该服务。

邀月工作室

邀月工作室

  如果还是不能正常启动MSDTC,请查阅MSDN(http://msdn.microsoft.com/zh-cn/library/aa561924%28BTS.10%29.aspx)以获取帮助。

 

四、进行分布式查询

  此时,我们在任意一个实例查询的结果都是一致的,也正是我们想要的。

/*************** 实例 AP4\NET2013(SQL Server 2008) *********/
/********* 3w@live.cn 邀月 ***************/
/***** 分布式查询  **************/

----AP4\NET2013上查询
--打开测试库
Use RemoteViewTest2012
GO
SET XACT_ABORT ON

SELECT WebHitID, WebSite, HitDT
FROM dbo.v_WebHits

SELECT WebHitID, WebSite, HitDT
FROM [AP4\NET2012].RemoteViewTest2012.dbo.WebHits_ShangHai

 

----AP4\N ET2012上查询
--打开测试库
Use RemoteViewTest2012
GO

SET XACT_ABORT ON

SELECT WebHitID, WebSite, HitDT
FROM dbo.v_WebHits

SELECT WebHitID, WebSite, HitDT
FROM [AP4\NET2013].RemoteViewTest2012.dbo.WebHits_BeiJing

 

邀月工作室

  我们欣喜地看到,SQL Server并没有在基础分区表中插入冗余数据,而是自动分发到了Check所约定的相应的表中,这得益于MSDTC的功劳。

邀月工作室

  注意:创建分布式视图的注意事项和必要条件,请看MSDN(http://msdn.microsoft.com/zh-cn/library/ms188299.aspx)。

 

  小结:分布式分区视图允许我们跨多个SQL Server实例划分数据。对于超大型数据库和拥有大量事务和读操作的SQL Server实例来说,这种设计让我们获益良多。根据被查询的视图,SQL Server能确定只查询本地分区表是否能满足某个查询请求,远程表是否需要查询,最终,SQL Server会最大限度地减少SQL Server实例间传输的数据总量。

posted @ 2012-04-12 02:06  邀月  阅读(5703)  评论(8编辑  收藏  举报