SQL Server 存储(3/8):理解GAM和SGAM页
我们知道SQL Server在8K 的页里存储数据。分区就是物理上连续的8个页。当我们创建一个数据库,数据文件会被逻辑分为页和区,当用户对象创建时,页会分配给它用来存储数据。GAM(Global Allocation Map)和SGAM(Shared Global Allocation Map)页用来跟踪SQL Server里空间分配情况。这里我们会一起讨论下SQL Server的空间分配,还有GAM和SGAM怎么帮助我们分配空间。
在SQL Server里有2类区:
统一区(Uniform Extent) :区属于一个用户对象。这些区的所有8页归一个对象所有。
混合区(Mixed Extent) :区属于各个用户对象。即区里的每个页都可以属于不同用户对象。
为了更好的管理空间分配,如果一个表或索引大小小于8页(即64k),SQL Server会分配混合区的页,而不是统一区的页。
我们在SQL Server里验证下。
新建一个表(这个表刚好一条记录一个页面),并插入26条记录,并通过DBCC IND查看这个表的相关页面:
1 USE InternalStorageFormat 2 GO 3 4 IF EXISTS ( SELECT * 5 FROM sysobjects 6 WHERE id = OBJECT_ID(N'[dbo].[TestSpaceAllocation]') 7 AND OBJECTPROPERTY(id, N'IsUserTable') = 1 ) 8 DROP TABLE dbo.TestSpaceAllocation 9 10 CREATE TABLE TestSpaceAllocation( 11 Name CHAR(8000) 12 ) 13 GO 14 15 INSERT INTO TestSpaceAllocation VALUES('Woody') 16 GO 26 17 18 DBCC IND('InternalStorageFormat','TestSpaceAllocation',1)
从上图我们可以清楚的看到,绿色区域的第一个8页不属于同个区(混合区),因为页面号不连续,207与94752之间有缺口。接下来蓝色和红色区域是属于同个区(统一区),因为它们的页面号是连续的。当我们以碎片级别来看待这个情况时,可以发现表越小,碎片越高。即使你用索引重建,这个高碎片也不会减少。这个背后的原因就是SQL Server分配新的表或索引对象时,总是首先从混合区分配空间。
SQL Server为新表或索引从混合区开始分配页。一旦表增长超过8页。SQL Server需要从统一区分配页。当表或索引为新的或修改的数据需要更多的容纳空间时,SQL Server需要这些表或索引分配页。如果表或索引的大小小于8页。SQL Sever需要从混合区给它们分配空间。如果大小超过8页,SQL Server需要从统一区分配页。SQL使用2类不同的页来更好管理这个分配操作。
全局分配映射表(GAM: Global Allocation Map Pages) :GAM页记录哪些些区已被使用分配。对于每个区,GAM都有一个位。如果这个位是1,表示对应的区是空闲可用的。如果这个位是0,表示对应区被统一区或混合区使用。一个GAM页可以保存64000个区的使用信息。这就是说,一个GAM可以保存近4G(64000 * 8 * 8/ 1024)数据文件的使用信息。简单来说,一个7G的数据文件会有2个GAM页。
共享全局分配映射表(SGAM: Shared Global Allocation Map Pages) :SGAM页记录哪些区已被作为混合区使用并至少有一个可用的空闲页。对于每个区,SGAM都有一个位。如果这个位是1,表示对应的区作为混合区使用并至少有一个可用的空闲页。如果这个位是0,表示这个区既没被混合区使用(作为统一区),或这个区的所有页都作为混合区使用了。一个SGAM页可以保存64000个区的使用信息。这就是说,一个SGAM可以保存近4G(64000 * 8 * 8/ 1024)数据文件的使用信息。简单来说,一个7G的数据文件会有2个SGAM页。
GAM和SGAM页帮助数据库引擎进行区管理。分配一个区,数据库引擎查找标记1的GAM页,然后标记为0。如果那个区是作为混合区分配,它会在SGAM页把对应区的标记为1。如果那个区是作为统一区分配,那就没有必要在SGAM里修改对应位标记。找一个有空页的混合区,数据库引擎在SGAM页查找标记为1的位。如果没找到,数据文件已经满了。解除一个区分配,数据库引擎会把对应GAM页里对应位设置为1,SGAM页里对应标记设置为0。
在每个数据文件里,第3个页(页号2,页号从0开始)是GAM页,第4个页(页号3,页号从0开始)是SGAM页。第1个页(页号0)是文件头(file header),第2个页(页号1)是PFS(Page Free Space)页。我们可以使用DBCC PAGE命令查看GAM和SGAM页。
我们在AdventureWorks2008R2数据库里验证下:
1 USE AdventureWorks2008R2 2 3 DBCC TRACEON(3604) 4 GO 5 DBCC page('AdventureWorks2008R2',1,2,3)
输出的结果最后一个部分:
第1行表示,在页0到页23112之间的区都已经被分配,也就是说页号从0到23129的页都被分配。
第2行表示,在页23120到页25072之间的区都没被分配,也就是说页号从22120到页25079的页都未被分配。
我们一起来看看分配的页23112和未分配的页23120在页头分配信息里的GAM分配情况。
1 DBCC TRACEON(3604) 2 GO 3 DBCC page('AdventureWorks2008R2',1,23112,1)
1 DBCC TRACEON(3604) 2 GO 3 DBCC page('AdventureWorks2008R2',1,23120,1)
可以看到在GAM页的分配信息和在对应页里页头的分配信息(Allocation Statu)是一致的。
我们来看看SGAM页的分配情况:
1 DBCC TRACEON(3604) 2 GO 3 DBCC page('AdventureWorks2008R2',1,3,3)
第1行表示,在页0到页11752之间的区都已经未被分配,也就是说这些区没被分配,或者是统一区,或者是没有空页的混合区,这里应该是统一区。
第2行表示,自页11760的区开始是混合区,并且至少有1个可用的页。
参考文章:
注:此文章为WoodyTu学习MS SQL技术,收集整理相关文档撰写,欢迎转载,请在文章页面明显位置给出此文链接!
若您觉得这篇文章还不错请点击下右下角的推荐,有了您的支持才能激发作者更大的写作热情,非常感谢!