代码的魅力

BI, .NET

导航

如何估算数据库的大小

Posted on 2010-09-19 14:56  moge  阅读(1600)  评论(0编辑  收藏  举报

--得到数据库中所有表的空间/记录情况

exec   sp_MSForEachTable  
@precommand=N '
create   table   ##(
id   int   identity,
表名   sysname,
字段数   int,
记录数   int,
保留空间   Nvarchar(10),
使用空间   varchar(10),
索引使用空间   varchar(10),
未用空间   varchar(10)) ',
@command1=N 'insert   ##(表名,记录数,保留空间,使用空间,索引使用空间,未用空间)   exec   sp_spaceused   ' '? ' '
update   ##   set   字段数=(select   count(*)   from   syscolumns   where   id=object_id( ' '? ' '))   where   id=scope_identity() ',
@postcommand=N 'select   *   from   ##   order   by   id   drop   table   ## '

 

以使用下列步骤估计在表中存储数据所需的空间:
1.   按照估计堆的大小或估计聚集索引的大小中的说明计算堆或聚集索引所需的空间。
2.   对于每个非聚集索引,按照估计非聚集索引的大小中的说明计算其所需的空间。
3.   对步骤   1   和步骤   2   中计算的值求和。

 

1.1   估计堆的大小
可以使用以下步骤估计在堆中存储数据所需的空间量:
指定表中显示的行数:  
Num_Rows   =   表中的行数
指定固定长度和可变长度列的数量,并计算存储所需的空间:
计算每组列在数据行中所占据的空间。列的大小取决于数据类型和长度说明。有关详细信息,请参阅   数据类型(数据库引擎)。  
Num_Cols   =   总列数(固定长度和可变长度)
Fixed_Data_Size   =   所有固定长度列的总字节大小
Num_Variable_Cols   =   可变长度列的数量
Max_Var_Size   =   所有可变长度列的最大字节大小
保留行中称为空位图的部分以管理列的为空性。计算大小:  
Null_Bitmap   =   2   +   ((Num_Cols   +   7)   /   8)
只应使用该表达式的整数部分。而去掉其余部分。  
计算可变长度数据的大小:
如果表中有可变长度列,请确定在行中存储这些列需使用的空间:  
Variable_Data_Size   =   2   +   (Num_Variable_Cols   x   2)   +   Max_Var_Size  
此公式假设所有可变长度列均百分之百充满。如果预计可变长度列占用的存储空间比例较低,则可以按照该比例调整   Max_Var_Size   值,从而对整个表大小得出一个更准确的估计。  
如果没有可变长度列,请将   Variable_Data_Size   设置为   0。  
计算总的行大小:  
Row_Size   =   Fixed_Data_Size   +   Variable_Data_Size   +   Null_Bitmap   +   4  
公式中的值   4   是数据行的行标题开销。
下一步,计算每页的行数(每页有   8096   可用字节):  
Rows_Per_Page   =   8096   /   (Row_Size   +   2)
因为行不跨页,所以每页的行数应向下舍入到最接近的整数。   公式中的数值   2   是计算行数时引入的行大小余量。
计算存储所有行所需的页数:  
Num_Pages   =   Num_Rows   /   Rows_Per_Page  
估计的页数应向上舍入到最接近的整数。  
计算在堆中存储数据所需的空间量(每页的总字节为   8192):  
堆大小(字节)=   8192   x   Num_Pages  
此计算不考虑以下因素:
分区  
分区的空间开销很小,但是计算复杂。是否包括它并不重要。
分配页
至少有一个   IAM   页用于跟踪为堆分配的页,但是空间开销很小,并且没有算法可以精确地计算出要使用的   IAM   页数。
大型对象   (LOB)   值
具体确定需要多少空间来存储   LOB   数据类型(varchar(max)、varbinary(max)、nvarchar(max)、text、ntext   xml   和   image)值的算法是复杂的。只添加所期望的   LOB   值的平均大小就足够了,然后将其添加至总的堆大小中。

1.2   估计聚集索引的大小
您可以使用下列步骤估计存储聚集索引中的数据所需的空间大小:
计算存储聚集索引叶级数据所用的空间。
计算存储聚集索引的索引信息所用的空间。
对计算出的值求和。
步骤1.   计算在叶级别存储数据所用的空间
指定表中显示的行数:  
Num_Rows   =   表中的行数
指定固定长度和可变长度列的数量,并计算存储所需的空间:
计算每组列在数据行中所占据的空间。列的大小取决于数据类型和长度规定。有关详细信息,请参阅数据类型(数据库引擎)。  
Num_Cols   =   总列数(固定长度和可变长度)
Fixed_Data_Size   =   所有固定长度列的总字节大小
Num_Variable_Cols   =   可变长度列的数量
Max_Var_Size   =   所有可变长度列的最大字节大小
如果聚集索引不唯一,则请说明“唯一标识符”列:
唯一标识符是可为空的可变长度列。在具有非唯一键值的行中,它非空而且大小为   4   个字节。此值是索引键的一部分,用于确保每一行都具有唯一的键值。
Num_Cols   =   Num_Cols   +   1
Num_Variable_Cols   =   Num_Variable_Cols   +   1
Max_Var_Size   =   Max_Var_Size   +   4
这些修改假定所有值都不是唯一的。
保留行中称为空位图的部分以管理列的为空性。计算大小:  
Null_Bitmap   =   2   +   ((Num_Cols   +   7)   /   8)  
仅使用上述表达式中的整数部分,而放弃所有余数。  
计算可变长度数据的大小:
如果表中有可变长度列,请确定在行中存储这些列需使用的空间:  
Variable_Data_Size   =   2   +   (Num_Variable_Cols   x   2)   +   Max_Var_Size  
此公式假设所有可变长度列均百分之百填充。如果预计可变长度列占用的存储空间比例较低,则可以按照该比例调整   Max_Var_Size   值,从而对整个表大小得出一个更准确的估计。  
注意:    
SQL   Server   2005   引入了组合   varchar、nvarchar、varbinary   或   sql_variant   列的功能,这些列使定义的表的总宽度超过   8,060   字节。对于   varchar、varbinary   或   sql_variant   中的每一列,其长度不能超过   8,000   字节,对于   nvarchar   列,不能超过   4,000   字节。但是,表中这些列的组合宽度可超过   8,060   字节。有关详细信息,请参阅行溢出数据超过   8   KB。
如果没有可变长度列,请将   Variable_Data_Size   设置为   0。  
计算总的行大小:  
Row_Size   =   Fixed_Data_Size   +   Variable_Data_Size   +   Null_Bitmap   +   4  
值   4   是数据行的行标题的开销。
下一步,计算每页的行数(每页有   8096   个可用字节):  
Rows_Per_Page   =   8096   /   (Row_Size   +   2)
因为行不能跨页,所以每页的行数应向下舍入到最接近的整数。公式中的值   2   是计算行数时引入的行大小余量。
根据指定的填充因子计算每页保留的空行数:
Free_Rows_Per_Page   =   8096   x   ((100   -   Fill_Factor)   /   100)   /   (Row_Size   +   2)  
计算中使用的填充因子为整数值,而不是百分比。因为行不能跨页,所以每页的行数应向下舍入到最接近的整数。填充因子增大时,每页将存储更多的数据,因此页数将减少。公式中的值   2   是计算行数时引入的行大小余量。
计算存储所有行所需的页数:  
Num_Pages   =   Num_Rows   /   (Rows_Per_Page   -   Free_Rows_Per_Page)  
估计的页数应向上舍入到最接近的整数。  
计算在叶级别中存储数据所需的空间大小(每页共有   8192   个字节):  
Leaf_space_used   =   8192   x   Num_Pages
步骤   2.   计算存储索引信息所用的空间
您可以使用下列步骤估计存储索引的较高级别所需的空间大小:  
指定索引键中固定长度和可变长度列的数量,并计算存储所需的空间:
索引键列可以包括固定长度和可变长度列。若要估计内部级别索引行的大小,请计算每组列在索引行中所占据的空间。列的大小取决于数据类型和长度规定。有关详细信息,请参阅数据类型(数据库引擎)。
Num_Key_Cols   =   总键列数(固定长度和可变长度)
Fixed_Key_Size   =   所有固定长度键列的总字节大小
Num_Variable_Key_Cols   =   可变长度键列的数量
Max_Var_Key_Size   =   所有可变长度键列的最大字节大小
如果索引不唯一,则请说明所需的任意唯一标识符:
唯一标识符是可为空的可变长度列。它将是非空的,在具有非唯一索引键值的行中的大小是   4   个字节。此值是索引键的一部分,用于确保每一行都具有唯一的键值。
Num_Key_Cols   =   Num_Key_Cols   +   1
Num_Variable_Key_Cols   =   Num_Variable_Key_Cols   +   1
Max_Var_Key_Size   =   Max_Var_Key_Size   +   4
这些修改假定所有值都不是唯一的。
计算空位图大小:
如果索引键中有允许为空的列,则索引行的一部分将为空位图保留。计算大小:  
Index_Null_Bitmap   =   2   +   ((可为空的键列数   +   7)   /   8)  
仅使用上述表达式中的整数部分,而放弃所有余数。  
如果没有可为空的键列,请将   Index_Null_Bitmap   设置为   0。
计算可变长度数据的大小:
如果索引中有可变长度列,请确定在索引行中存储这些列需使用的空间:  
Variable_Key_Size   =   2   +   (Num_Variable_Key_Cols   x   2)   +   Max_Var_Key_Size  
此公式假设所有可变长度列均百分之百填充。如果预计可变长度列占用的存储空间比例较低,则可以按照该比例调整   Max_Var_Key_Size   值,从而对整个表大小得出一个更准确的估计。  
如果没有可变长度列,请将   Variable_Key_Size   设置为   0。  
计算索引行大小:  
Index_Row_Size   =   Fixed_Key_Size   +   Variable_Key_Size   +   Index_Null_Bitmap   +   1(对应于索引行的行标题开销)+   6(对应于子页   ID   指针)
下一步,计算每页的索引行数(每页有   8096   个可用字节):  
Index_Rows_Per_Page   =   8096   /   (Index_Row_Size   +   2)  
因为索引行不能跨页,所以每页的索引行数应向下舍入到最接近的整数。公式中的数值   2   是计算行数时引入的行大小余量。
计算索引中的级别数:
Levels   =   1   +   log   Index_Rows_Per_Page   (Num_Rows   /   Index_Rows_Per_Page)
注意:该值不包括聚集索引的叶级别。
计算索引中的页数:  
Num_Index_Pages   =   Level   (Index_Rows_Per_Page)Level   –   1
其中,1   <=   Level   <=   Levels
这是一个简单的示例,所讨论的索引在叶以上的级别共需要   1000   个索引行,每页容纳   10   个索引行。这意味着存储这   1000   行需要   100   页。下一级索引必须存储   100   行。这意味着需要   10   页。最后一级索引必须存储   10   行。这意味着需要   1   页。如果将这些数代入前面的公式中,结果如下:
Height   =   1   +   log10   (1000   /   10)   =   3
Num_Index_Pages   =   (10)3-1   +   (10)2-1   +   (10)1-1   =   111,这是示例中所述的页数。
计算索引的大小(每页共有   8192   个字节):  
Index_Space_Used   =   8192   x   Num_Index_Pages  
步骤   3.   对计算出的值求和
对从前面两个步骤中得到的值求和:  
聚集索引大小(字节)=   Leaf_Space_Used   +   Index_Space_used
此计算不考虑以下因素:
分区  
分区的空间开销很小,但是计算复杂。是否包括它并不重要。
分配页
至少有一个   IAM   页用于跟踪为堆分配的页,但是空间开销很小,并且没有算法可以精确地计算出要使用的   IAM   页数。
大型对象   (LOB)   值
精确确定存储   LOB   数据类型   varchar(max)、varbinary(max)、nvarchar(max)、text、ntext、xml   和   image   值所用的空间量的算法非常复杂。只需加上所期望的   LOB   值的平均大小、再乘以   Num_Rows,然后再加上聚集索引的总大小。

 

2   对于每个非聚集索引,按照估计非聚集索引的大小中的说明计算其所需的空间
可使用下列步骤估计存储非聚集索引所需的空间大小:  
计算用于存储非聚集索引的非叶级中的索引信息的空间。
计算用于存储非聚集索引的叶级中的索引信息的空间。
对计算出的值求和。
步骤   1.   计算用于存储非叶级中的索引信息的空间
重要事项:    
保留在此步骤中使用的值,以便在步骤   2   中使用。
可使用下列步骤估计存储索引的较高级别所需的空间大小。
指定表中显示的行数:  
Num_Rows   =   表中的行数
指定索引键中固定长度和可变长度列的数量,并计算存储所需的空间:
索引键列可以包括固定长度和可变长度列。若要估计内部级别索引行的大小,请计算每组列在索引行中所占据的空间。列的大小取决于数据类型和长度规定。有关详细信息,请参阅数据类型(数据库引擎)。
Num_Key_Cols   =   总键列数(固定长度和可变长度)
Fixed_Key_Size   =   所有固定长度键列的总字节大小
Num_Variable_Key_Cols   =   可变长度键列的数量
Max_Var_Key_Size   =   所有可变长度键列的最大字节大小
如果索引不是唯一的,对所需的数据行定位符说明如下:
如果非聚集索引不是唯一的,数据行定位符将与非聚集索引键组合使用,以便为每一行生成唯一的键值。
如果非聚集索引在堆上,则数据行定位符是堆   RID。其大小是   8   个字节。  
Num_Key_Cols   =   Num_Key_Cols   +   1
Num_Variable_Key_Cols   =   Num_Variable_Key_Cols   +   1
Max_Var_Key_Size   =   Max_Var_Key_Size   +   8
如果非聚集索引在聚集索引之上,则数据行定位符是聚集键。必须与非聚集索引键结合使用的列是聚集键中的以下列:不在非聚集索引键列集中的列。
Num_Key_Cols   =   Num_Key_Cols   +   不在非聚集索引键列集中的聚集键列数(如果聚集索引不唯一,则   +   1)
Fixed_Key_Size   =   Fixed_Key_Size   +   不在非聚集索引键列集中的固定长度聚集键列的总字节大小
Num_Variable_Key_Cols   =   Num_Variable_Key_Cols   +   不在非聚集索引键列集中的可变长度聚集键列数(如果聚集索引不唯一,则   +   1)
Max_Var_Key_Size   =   Max_Var_Key_Size   +   不在非聚集索引键列集中的可变长度聚集键列的最大字节大小(如果聚集索引不唯一,则   +   4)
可以保留行的一部分(称为“空位图”),以管理列的为空性。计算大小:
如果索引键中有可为空的列(包括步骤   1.3   中所述的所有必要的聚集键列),则保留索引行的一部分,以用于空位图。
Index_Null_Bitmap   =   2   +   ((可以为空的键列数   +   7)   /   8)  
仅使用上述表达式中的整数部分,而放弃所有余数。  
如果没有可为空的键列,请将   Index_Null_Bitmap   设置为   0。
计算可变长度数据大小:
如果索引键中有可变长度的列(包括所有必要的聚集索引键列),请确定存储索引行中的这些列需使用的空间:  
Variable_Key_Size   =   2   +   (Num_Variable_Key_Cols   x   2)   +   Max_Var_Key_Size  
此公式假设所有可变长度列均百分之百填充。如果预计可变长度列占用的存储空间比例较低,则可以按照该比例调整   Max_Var_Key_Size   值,从而对整个表大小得出一个更准确的估计。  
如果没有可变长度列,请将   Variable_Key_Size   设置为   0。  
计算索引行大小:  
Index_Row_Size   =   Fixed_Key_Size   +   Variable_Key_Size   +   Index_Null_Bitmap   +   1(对应于索引行的行标题开销)+   6(对应于子页   ID   指针)
下一步,计算每页的索引行数(每页有   8096   个可用字节):  
Index_Rows_Per_Page   =   8096   /   (Index_Row_Size   +   2)  
因为索引行不能跨页,所以每页的索引行数应向下舍入到最接近的整数。公式中的数值   2   是计算行数时引入的行大小余量。
计算索引中的级别数:
Levels   =   1   +   log   Index_Rows_Per_Page   (Num_Rows   /   Index_Rows_Per_Page)
请注意,此值不包括叶级非聚集索引。
计算索引中的页数:  
Num_Index_Pages   =   Level   (Index_Rows_Per_Page)Level   –   1
其中,1   <=   Level   <=   Levels
作为一个简单示例,请考虑这样的索引:其中叶级以上的级别所需总索引行数是   1000,且每页可容纳   10   个索引行。这意味着存储这   1000   行需要   100   页。下一级索引必须存储   100   行。这意味着需要   10   页。最后一级索引必须存储   10   行。这意味着需要   1   页。使用这些以前的公式中的数字可得到下列结果:
Height   =   1   +   log10   (1000   /   10)   =   3
Num_Index_Pages   =   (10)3-1   +   (10)2-1   +   (10)1-1   =   111,这是示例中所述的页数。
计算聚集索引的大小(每页总共有   8192   个字节):  
Index_Space_Used   =   8192   x   Num_Index_Pages  
步骤   2.   计算用于存储叶级中的索引信息的空间
可使用下列步骤估计存储叶级索引所需的空间大小。需要使用从步骤   1   中保留的值来完成此步骤。  
指定叶级的固定长度列和可变长度列的数量,并计算存储这些列所需的空间:

注意:    
SQL   Server   2005   通过包括索引键列和非键列引入了扩展非聚集索引的功能。这些额外的列只存储在叶级非聚集索引。有关详细信息,请参阅创建带有包含性列的索引。
注意:    
SQL   Server   2005   引入了组合   varchar、nvarchar、varbinary   或   sql_variant   列的功能,这些列使定义的表的总宽度超过   8,060   字节。对于   varchar、varbinary   或   sql_variant   中的每一列,其长度不能超过   8,000   字节,对于   nvarchar   列,不能超过   4,000   字节。但是,表中这些列的组合宽度可超过   8,060   字节。这也适用于具有包含性列的非聚集索引叶行。有关详细信息,请参阅行溢出数据超过   8   KB。
如果非聚集索引没有任何包含性列,则使用步骤   1   中的值(包括在步骤   1.3   中进行的任何修改):
Num_Leaf_Cols   =   Num_Key_Cols
Fixed_Leaf_Size   =   Fixed_Key_Size
Num_Variable_Leaf_Cols   =   Num_Variable_Key_Cols
Max_Var_Leaf_Size   =   Max_Var_Key_Size
如果非聚集索引确实具有包含性列,则对步骤   1   中的值加上适当的值(包括在步骤   1.3   中进行的任何修改)。列的大小取决于数据类型和长度规定。有关详细信息,请参阅数据类型(数据库引擎)。
Num_Leaf_Cols   =   Num_Key_Cols   +   包含性列数
Fixed_Leaf_Size   =   Fixed_Key_Size   +   固定长度包含性列的总字节大小
Num_Variable_Leaf_Cols   =   Num_Variable_Key_Cols   +   可变长度包含性列的数量
Max_Var_Leaf_Size   =   Max_Var_Key_Size   +   可变长度包含性列的最大字节大小
数据行定位符说明:
如果非聚集索引不是唯一的,则已在步骤   1.3   中考虑了数据行定位符的开销且不需要进行其他的修改。转到下一步。
如果非聚集索引是唯一的,则必须在叶级的所有行中说明数据行定位符。
如果非聚集索引在堆上,则数据行定位符是堆   RID(大小为   8   字节)。
Num_Leaf_Cols   =   Num_Leaf_Cols   +   1
Num_Variable_Leaf_Cols   =   Num_Variable_Leaf_Cols   +   1
Max_Var_Leaf_Size   =   Max_Var_Leaf_Size   +   8
如果非聚集索引在聚集索引之上,则数据行定位符是聚集键。必须与非聚集索引键结合使用的列是聚集键中的以下列:不在非聚集索引键列集中的列。
Num_Leaf_Cols   =   Num_Leaf_Cols   +   不在非聚集索引键列集中的聚集键列数(如果聚集索引不唯一,则   +   1)
Fixed_Leaf_Size   =   Fixed_Leaf_Size   +   不在非聚集索引键列集中的固定长度聚集键列数
Num_Variable_Leaf_Cols   =   Num_Variable_Leaf_Cols   +   不在非聚集索引键列集中的可变长度聚集键列数(如果聚集索引不唯一,则   +   1)
Max_Var_Leaf_Size   =   Max_Var_Leaf_Size   +   不在非聚集索引键列集中的可变长度聚集键列的字节大小(如果聚集索引不唯一,则   +   4)
计算空位图大小:
Leaf_Null_Bitmap   =   2   +   ((Num_Leaf_Cols   +   7)   /   8)  
仅使用上述表达式中的整数部分,而放弃所有余数。  
计算可变长度数据大小:
如果索引键中有可变长度的列(包括在以前的步骤   2.2   中所述的所有必要的聚集索引键列),请确定存储索引行中的这些列需使用的空间:  
Variable_Leaf_Size   =   2   +   (Num_Variable_Leaf_Cols   x   2)   +   Max_Var_Leaf_Size  
此公式假定所有可变长度列均百分之百填充。如果预计可变长度列占用的存储空间比例较低,则可以按照该比例调整   Max_Var_Leaf_Size   值,从而对整个表大小得出一个更准确的估计。  
如果没有可变长度的列,则将   Variable_Key_Size   设置为   0。  
计算索引行大小:  
Index_Row_Size   =   Fixed_Key_Size   +   Variable_Key_Size   +   Index_Null_Bitmap   +   1(对应于索引行的行标题开销)+   6(对应于子页   ID   指针)
下一步,计算每页的索引行数(每页有   8096   个可用字节):  
Leaf_Rows_Per_Page   =   8096   /   (Leaf_Row_Size   +   2)  
因为索引行不能跨页,所以每页的索引行数应向下舍入到最接近的整数。公式中的数值   2   是计算行数时引入的行大小余量。
根据指定的填充因子计算每页保留的空行数:
Free_Rows_Per_Page   =   8096   x   ((100   -   Fill_Factor)   /   100)   /   (Leaf_Row_Size   +   2)  
计算中使用的填充因子为整数值,而不是百分比。因为行不跨页,所以每页的行数应向下舍入到最接近的整数。填充因子增大时,每页将存储更多的数据,因此页数将减少。公式中的数值   2   是计算行数时引入的行大小余量。
计算存储所有行所需的页数:  
Num_Leaf_Pages   =   Num_Rows   /   (Leaf_Rows_Per_Page   -   Free_Rows_Per_Page)  
估计的页数应向上舍入到最接近的整数。  
计算索引的大小(每页总共有   8192   个字节):
Leaf_Space_Used   =   8192   x   Num_Leaf_Pages  
步骤   3.   对计算出的值求和
对从前面两个步骤中得到的值求和:  
Nonclustered   index   size   (bytes)   =   Leaf_Space_Used   +   Index_Space_used
此计算不考虑以下因素:
分区  
分区的空间开销很小,但是计算复杂。是否包括它并不重要。
分配页
至少有一个   IAM   页用于跟踪为堆分配的页,但是空间开销很小,并且没有算法可以精确地计算出要使用的   IAM   页数。
大型对象   (LOB)   值
精确确定存储   LOB   数据类型   varchar(max)、varbinary(max)、nvarchar(max)、text、ntext、xml   和   image   值所用的空间量的算法非常复杂。只需加上期望的   LOB   值的平均大小,再乘以   Num_Rows,然后将所得结果加到非聚集索引的总大小。