《Microsoft Sql server 2008 Internal》读书笔记--第七章Special Storage(3)
《Microsoft Sql server 2008 Interna》读书笔记订阅地址:
http://www.cnblogs.com/downmoon/category/230397.html/rss
《Microsoft Sql server 2008 Interna》索引目录:
《Microsoft Sql server 2008 Internal》读书笔记--目录索引
上文简单介绍了不限长度的Large Object Data存储形式,以及存储在数据行的LOB数据。本文简要介绍MAX-Length数据及添加数据到LOB列的存储,另外主要介绍filestream 数据的基础。
■MAX-Length数据的存储
SQL2005/2008给我们MAX定义符选项来定义可变长度字段。通过MAX定义,你可以让SQL Server来决定存储值作为常规的varchar,nvarchar或varbinary或LOB数据(通常在大于8000字节时会使用text,ntext,image)。
■附加数据到LOB列
在存储引擎中,每一个LOB列被分解成不大于8040字节的碎片。当附加数据到LOB列时,SQL Server查找附加点,并试图寻找新数据将被增加的位置,新老数据如果合起来大于8040字节,那么分配一个大对象页(Large Object Page)直到余下的碎片小于8040字节,再寻找一个页存放其余的字节。当SQL Server为LOB数据分配页时,它有两个分配策略:(1)如果数据小于64Kb,随机分配一个页。这个页来自一个大对象IAM的部分的一个范围(extent),但页不一定是连续的。(2)如果大于64KB,它使用一个附加页分配器,一次性的分配一个范围,在这个范围中连续地写数据。因而,推荐的做法是:如果需要插入64KB数据,那么一次插入8*8040时,数据将是继续存放的,而且是在一个范围(extent)内。
如果你发现一个Large Object 数据变得越来越碎片,可以使用ALter Index reorganize选项来整理它。前提是默认打开为ON的WithLOB_compaction选项你没有关闭它。
■文件流数据(FileStream Data)
尽管SQL Server提供了很大的便利,使得你可以在数据库中灵活存储Large object Data。好处:
1、大对象数据的事务一致性可以保证。
2、包含大对象数据的备份与恢复,允许你完整地在某个时刻点恢复大对象数据。
3、所有的数据使用一个单一的存储和查询环境。
但是也有一些不利因素:
1、大对象数据在缓存中占用大量的缓冲器。
2、更新一个大对象会引起大范围的数据整理。
3、数据库文件会变得非常大。
SQL Server 2008 和 SQL Server Native Client 10.0 支持增强的 FILESTREAM 功能。FILESTREAM 功能允许通过 SQL Server 或通过直接访问 Windows 文件系统来存储和访问大型二进制值。大型二进制值是大于 2 GB 的值。有关增强的 FILESTREAM 支持的详细信息,请参阅FILESTREAM 概述。文件流来作为一种大数据存储方案,其优势:
1、大对象数据存储在文件系统中却在数据库中有一个48字节的文件指针值存储在包含文件流的列中。
2、大对象数据可以通过T-SQL和NTFS 流APIs来访问。
3、大对象数据的大小仅受限于NTFS值大小,而不是老的2GB大小限制(LOB数据)
劣势:
1、数据库镜像不能被用于包含文件流数据的数据库。
2、数据库快照不能包含文件流文件组,因而,文件流数据不可用。在快照中使用slect请求一个文件流列会出错。
3、文件流数据不能被SQL Server本地加密。
■为SQL Server启用文件流数据(FileStream Data)
如图即可启用文件流数据:
启用后必须使用sp_configure设置SQL Server实例到你需要的文件访问级别。三个值:0代表文件流访问许可;1代表你可以使用 T—SQL访问文件流数据;2代表你可以使用T-SQL和特定的Win32 流API作为文件流访问。
RECONFIGURE;
■创建一个启用文件流的数据库
FILESTREAM 数据必须存储在 FILESTREAM 文件组中。在创建数据库时,必须至少为一个文件组指定 CONTAINS FILESTREAM 子句。FILESTREAM 文件组是包含文件系统目录而非文件本身的专用文件组。这些文件系统目录称为“数据容器” 。数据容器是数据库引擎存储与文 件系统存储之间的接口。更多,请看MSDN:
http://msdn.microsoft.com/zh-cn/library/bb933993.aspx
下面例子创建一个包含FileStream的数据库。
ON
PRIMARY ( NAME = Rowdata1,
FILENAME = 'D:\Data2\Rowdata1.mdf'),
FILEGROUP FileStreamGroup1 CONTAINS FILESTREAM DEFAULT( NAME = FSData1,
FILENAME = 'D:\Data2\filestream1'),
FILEGROUP FileStreamGroup2 CONTAINS FILESTREAM ( NAME = FSData2,
FILENAME = 'D:\Data2\filestream2')
LOG ON ( NAME = FSDBLOG,
FILENAME = 'D:\Data2\FSDB_log.ldf');
以上语句执行时,SQL Server在D:\Data2下创建了两个文件夹,filestream1和filestream2,初始时,每个窗口包含了一个空目录$FSLOG和一个名为filestream.hdr的头文件。当一个容器中的表被创建,并使用文件流空间时,每一个包含Filestream的分区或表的文件夹被在容器内创建。对于现有数据库,可以使用 ALTER DATABASE 语句来添加 FILESTREAM 文件组,随后通过alter database在Filestream文件组中增加一个文件。记住:不能在master,model,tempdb中增加filestream文件组
■创建一个存放FileStream的表
(
[Id] [uniqueidentifier] ROWGUIDCOL NOT NULL UNIQUE,
[SerialNumber] INTEGER UNIQUE,
[Chart_Primary] VARBINARY(MAX) FILESTREAM NULL,
[Chart_Secondary] VARBINARY(MAX) FILESTREAM NULL)
FILESTREAM_ON FileStreamGroup1;
警告:当你drop这个表时,文件夹及子文件夹、包含文件并不会被文件系统立刻移走。而是等待垃圾回收器线程(Garbage Collection Thread)处理。此时你可以手工删除这些文件,但要小心。
■操作(Manipulating)FileStream数据
FileStream数据能被T-SQL或win32 API操作。当你使用T-SQL时,数据被当作varbinary(Max)准确地处理,而使用win32 API需要你首先获取文件路径和当前事务上下文。本章中例子主要使用T-SQL,win32API的例子,请参看MSDN.
■insert FileStream data
INSERT INTO dbo.Records
SELECT newid (), 24,
CAST (REPLICATE (CONVERT(varchar(MAX), 'Base Data'), 10000)
AS varbinary(max)),
0x;
注意0x是空的二进制字符串,不同于null,在filestream列中有一个not-null值的行对应一个文件,即使是0值。
下文将继续介绍Filestream和稀疏列。