《Microsoft Sql server 2008 Internal》读书笔记--第七章Special Storage(3)

《Microsoft Sql server 2008 Interna》读书笔记订阅地址:

http://www.cnblogs.com/downmoon/category/230397.html/rss

《Microsoft Sql server 2008 Interna》索引目录:

《Microsoft Sql server 2008 Internal》读书笔记--目录索引

上文简单介绍了不限长度的Large Object Data存储形式,以及存储在数据行的LOB数据。本文简要介绍MAX-Length数据及添加数据到LOB列的存储,另外主要介绍filestream 数据的基础。

MAX-Length数据的存储

SQL2005/2008给我们MAX定义符选项来定义可变长度字段。通过MAX定义,你可以让SQL Server来决定存储值作为常规的varchar,nvarchar或varbinary或LOB数据(通常在大于8000字节时会使用text,ntext,image)。

 附加数据到LOB列

在存储引擎中,每一个LOB列被分解成不大于8040字节的碎片。当附加数据到LOB列时,SQL Server查找附加点,并试图寻找新数据将被增加的位置,新老数据如果合起来大于8040字节,那么分配一个大对象页(Large Object Page)直到余下的碎片小于8040字节,再寻找一个页存放其余的字节。当SQL Server为LOB数据分配页时,它有两个分配策略:(1)如果数据小于64Kb,随机分配一个页。这个页来自一个大对象IAM的部分的一个范围(extent),但页不一定是连续的。(2)如果大于64KB,它使用一个附加页分配器,一次性的分配一个范围,在这个范围中连续地写数据。因而,推荐的做法是:如果需要插入64KB数据,那么一次插入8*8040时,数据将是继续存放的,而且是在一个范围(extent)内。
如果你发现一个Large Object 数据变得越来越碎片,可以使用ALter Index reorganize选项来整理它。前提是默认打开为ON的WithLOB_compaction选项你没有关闭它。

 文件流数据(FileStream Data)

尽管SQL Server提供了很大的便利,使得你可以在数据库中灵活存储Large object Data。好处:

1、大对象数据的事务一致性可以保证。

2、包含大对象数据的备份与恢复,允许你完整地在某个时刻点恢复大对象数据。

3、所有的数据使用一个单一的存储和查询环境。

但是也有一些不利因素:

1、大对象数据在缓存中占用大量的缓冲器。

2、更新一个大对象会引起大范围的数据整理。

3、数据库文件会变得非常大。

SQL Server 2008 和 SQL Server Native Client 10.0 支持增强的 FILESTREAM 功能。FILESTREAM 功能允许通过 SQL Server 或通过直接访问 Windows 文件系统来存储和访问大型二进制值。大型二进制值是大于 2 GB 的值。有关增强的 FILESTREAM 支持的详细信息,请参阅FILESTREAM 概述。文件流来作为一种大数据存储方案,其优势:

1、大对象数据存储在文件系统中却在数据库中有一个48字节的文件指针值存储在包含文件流的列中。

2、大对象数据可以通过T-SQL和NTFS 流APIs来访问。

3、大对象数据的大小仅受限于NTFS值大小,而不是老的2GB大小限制(LOB数据)

劣势:

1、数据库镜像不能被用于包含文件流数据的数据库。

2、数据库快照不能包含文件流文件组,因而,文件流数据不可用。在快照中使用slect请求一个文件流列会出错。

3、文件流数据不能被SQL Server本地加密。

为SQL Server启用文件流数据(FileStream Data)

如图即可启用文件流数据:

邀月工作室 

启用后必须使用sp_configure设置SQL Server实例到你需要的文件访问级别。三个值:0代表文件流访问许可;1代表你可以使用 T—SQL访问文件流数据;2代表你可以使用T-SQL和特定的Win32 流API作为文件流访问。

EXEC sp_configure 'filestream access level'1;
RECONFIGURE

创建一个启用文件流的数据库 

 FILESTREAM 数据必须存储在 FILESTREAM 文件组中。在创建数据库时,必须至少为一个文件组指定 CONTAINS FILESTREAM 子句。FILESTREAM 文件组是包含文件系统目录而非文件本身的专用文件组。这些文件系统目录称为“数据容器” 。数据容器是数据库引擎存储与文 件系统存储之间的接口。更多,请看MSDN:

http://msdn.microsoft.com/zh-cn/library/bb933993.aspx 

下面例子创建一个包含FileStream的数据库。

CREATE DATABASE MyFilestreamDB
ON
PRIMARY ( NAME = Rowdata1,
    FILENAME 
= 'D:\Data2\Rowdata1.mdf'),
FILEGROUP FileStreamGroup1 
CONTAINS FILESTREAM DEFAULT( NAME = FSData1,
    FILENAME 
= 'D:\Data2\filestream1'),
FILEGROUP FileStreamGroup2 
CONTAINS FILESTREAM ( NAME = FSData2,
    FILENAME 
= 'D:\Data2\filestream2')
LOG ON  ( NAME = FSDBLOG,
    FILENAME 
= 'D:\Data2\FSDB_log.ldf'); 

 邀月工作室

 以上语句执行时,SQL Server在D:\Data2下创建了两个文件夹,filestream1和filestream2,初始时,每个窗口包含了一个空目录$FSLOG和一个名为filestream.hdr的头文件。当一个容器中的表被创建,并使用文件流空间时,每一个包含Filestream的分区或表的文件夹被在容器内创建。对于现有数据库,可以使用 ALTER DATABASE 语句来添加 FILESTREAM 文件组,随后通过alter database在Filestream文件组中增加一个文件。记住:不能在master,model,tempdb中增加filestream文件组

 创建一个存放FileStream的表

CREATE TABLE MyFilestreamDB.dbo.Records
(
    
[Id] [uniqueidentifier] ROWGUIDCOL NOT NULL UNIQUE,
    
[SerialNumber] INTEGER UNIQUE,
    
[Chart_Primary] VARBINARY(MAX) FILESTREAM NULL,
    
[Chart_Secondary] VARBINARY(MAX) FILESTREAM NULL)
FILESTREAM_ON FileStreamGroup1;

邀月工作室
 警告:当你drop这个表时,文件夹及子文件夹、包含文件并不会被文件系统立刻移走。而是等待垃圾回收器线程(Garbage Collection Thread)处理。此时你可以手工删除这些文件,但要小心。

  操作(Manipulating)FileStream数据

 FileStream数据能被T-SQL或win32 API操作。当你使用T-SQL时,数据被当作varbinary(Max)准确地处理,而使用win32 API需要你首先获取文件路径和当前事务上下文。本章中例子主要使用T-SQL,win32API的例子,请参看MSDN.

 insert FileStream data

 USE MyFileStreamDB
INSERT INTO dbo.Records
    
SELECT newid (), 24,
      
CAST (REPLICATE (CONVERT(varchar(MAX), 'Base Data'), 10000)
            
AS varbinary(max)),
      0x;

 注意0x是空的二进制字符串,不同于null,在filestream列中有一个not-null值的行对应一个文件,即使是0值。

 邀月工作室

下文将继续介绍Filestream和稀疏列。
 

posted @ 2010-05-06 08:01  邀月  阅读(2426)  评论(5编辑  收藏  举报