深入学习分区表及分区索引

前言:

这篇文章的来源是来自我的csdn上面的一个帖子,

欢迎大家前来拍砖

oracle 大数据查询优化的方案

http://topic.csdn.net/u/20100520/10/3dfeada0-0f2a-4250-9433-34a0c18558af.html

关于分区表和分区索引(About Partitioned Tables and Indexes)

对于10gR2而言，基本上可以分成几类：

v Range(范围)分区

v Hash(哈希)分区

v List(列表)分区

v 以及组合分区：Range-Hash,Range-List。

对于表而言(常规意义上的堆组织表)，上述分区形式都可以应用(甚至可以对某个分区指定compress属性)，只不过分区依赖列不能是lob,long之类数据类型，每个表的分区或子分区数的总数不能超过1023个。

对于索引组织表，只能够支持普通分区方式，不支持组合分区，常规表的限制对于索引组织表同样有效，除此之外呢，还有一些其实的限制，比如要求索引组织表的分区依赖列必须是主键才可以等。

注：本篇所有示例仅针对常规表，即堆组织表！

对于索引，需要区分创建的是全局索引，或本地索引：

l 全局索引(global index)：即可以分区，也可以不分区。即可以建range分区，也可以建hash分区，即可建于分区表，又可创建于非分区表上，就是说，全局索引是完全独立的，因此它也需要我们更多的维护操作。

l 本地索引(local index)：其分区形式与表的分区完全相同，依赖列相同，存储属性也相同。对于本地索引，其索引分区的维护自动进行，就是说你add/drop/split/truncate表的分区时，本地索引会自动维护其索引分区。

Oracle建议如果单个表超过2G就最好对其进行分区，对于大表创建分区的好处是显而易见的，这里不多论述why，而将重点放在when以及how。

WHEN

一、When使用Range分区

Range分区呢是应用范围比较广的表分区方式，它是以列的值的范围来做为分区的划分条件，将记录存放到列值所在的range分区中，比如按照时间划分，2008年1季度的数据放到a分区，08年2季度的数据放到b分区，因此在创建的时候呢，需要你指定基于的列，以及分区的范围值，如果某些记录暂无法预测范围，可以创建maxvalue分区，所有不在指定范围内的记录都会被存储到maxvalue所在分区中，并且支持指定多列做为依赖列，后面在讲how的时候会详细谈到。

二、When使用Hash分区

通常呢，对于那些无法有效划分范围的表，可以使用hash分区，这样对于提高性能还是会有一定的帮助。hash分区会将表中的数据平均分配到你指定的几个分区中，列所在分区是依据分区列的hash值自动分配，因此你并不能控制也不知道哪条记录会被放到哪个分区中，hash分区也可以支持多个依赖列。

三、When使用List分区

List分区与range分区和hash分区都有类似之处，该分区与range分区类似的是也需要你指定列的值，但这又不同与range分区的范围式列值---其分区值必须明确指定，也不同与hash分区---通过明确指定分区值，你能控制记录存储在哪个分区。它的分区列只能有一个，而不能像range或者hash分区那样同时指定多个列做为分区依赖列，不过呢，它的单个分区对应值可以是多个。

你在分区时必须确定分区列可能存在的值，一旦插入的列值不在分区范围内，则插入/更新就会失败，因此通常建议使用list分区时，要创建一个default分区存储那些不在指定范围内的记录，类似range分区中的maxvalue分区。

四、When使用组合分区

如果某表按照某列分区之后，仍然较大，或者是一些其它的需求，还可以通过分区内再建子分区的方式将分区再分区，即组合分区的方式。

组合分区呢在10g中有两种：range-hash，range-list。注意顺序哟，根分区只能是range分区，子分区可以是hash分区或list分区。

提示：11g在组合分区功能这块有所增强，又推出了range-range,list-range,list-list,list-hash，这就相当于除hash外三种分区方式的笛卡尔形式都有了。为什么会没有hash做为根分区的组合分区形式呢，再仔细回味一下第二点，你一定能够想明白~~。

创建range分区

HOW

一、如何创建

如果想对某个表做分区，必须在创建表时就指定分区，我们可以对一个包含分区的表中的分区做修改，但不能直接将一个未分区的表修改成分区表(起码在10g是不行的，当然你可能会说，可以通过在线重定义的方式，但是这不是直接哟，这也是借助临时表间接实现的)。

创建表或索引的语法就不说了，大家肯定比我还熟悉，而想在建表(索引)同时指定分区也非常容易，只需要把创建分区的子句放到";"前就行啦，同时需要注意表的row movement属性，它用来控制是否允许修改列值所造成的记录移动至其它分区存储，有enable|disable两种状态，默认是disable row movement，当disable时，如果记录要被更新至其它分区，则更新语句会报错。

下面分别演示不同分区方式的表和索引的创建：

1、创建range分区

语法如下，图：

需要我们指定的有：

l column:分区依赖列(如果是多个，以逗号分隔);

l partition:分区名称;

l values less than:后跟分区范围值(如果依赖列有多个，范围对应值也应是多个，中间以逗号分隔);

l tablespace_clause:分区的存储属性，例如所在表空间等属性(可为空)，默认继承基表所在表空间的属性。

①　创建一个标准的range分区表：

 1 create table t_partition_range (
 2   id number,
 3   name varchar2(50)
 4 )
 5  partition by range(id)(
 6    partition t_range_p1 values less than (10) tablespace tbspart01,
 7    partition t_range_p2 values less than (20) tablespace tbspart02,
 8    partition t_range_p3 values less than (30) tablespace tbspart03,
 9    partition t_range_pmax values less than (maxvalue) tablespace tbspart04
10  );
11 
12  
13 
14  -- 表已创建。
15

要查询创建分区的信息，可以通过查询user_part_tables,user_tab_partitions两个数据字典（索引分区、组织分区等信息也有对应的数据字典，后续示例会逐步提及）。

user_part_tables：记录分区的表的信息;

user_tab_partitions：记录表的分区的信息。

例如：

 1 select table_name,partitioning_type,partition_count
 2   From user_part_tables where   table_name='T_PARTITION_RANGE';
 3 
 4  
 5 
 6 TABLE_NAME                     PARTITI PARTITION_COUNT
 7 
 8  ------------------------------          -------           ---------------
 9  
10 T_PARTITION_RANGE              RANGE                 4
11 
12  
13 
14  select partition_name,high_value,tablespace_name
15  from user_tab_partitions where table_name='T_PARTITION_RANGE'
16  order by partition_position;
17 
18  
19 
20 PARTITION_NAME                 HIGH_VALUE TABLESPACE_NAME
21 
22  ------------------------------ ---------- --------------------
23  
24 T_RANGE_P1                     10         TBSPART01
25 
26 T_RANGE_P2                     20         TBSPART02
27 
28 T_RANGE_P3                     30         TBSPART03
29 
30 T_RANGE_PMAX                   MAXVALUE   TBSPART04
31

②　创建global索引range分区：

1 create index idx_parti_range_id on t_partition_range(id)global partition by range(id)( 
2    partition i_range_p1 values less than (10) tablespace tbspart01,
3    partition i_range_p2 values less than (40) tablespace tbspart02,
4    partition i_range_pmax values less than (maxvalue) tablespace tbspart035 
5 );
6 
7  -- 索引已创建。

由上例可以看出，创建global索引的分区与创建表的分区语句格式完全相同，而且其分区形式与索引所在表的分区形式没有关联关系。

注意：我们这里借助上面的表t_partition_range来演示创建range分区的global索引，并不表示range分区的表，只能创建range分区的global索引，只要你想，也可以为其创建hash分区的global索引。

查询索引的分区信息可以通过user_part_indexes、user_ind_partitions两个数据字典：

 1 select index_name, partitioning_type, partition_count
 2  From user_part_indexes
 3  where index_name = 'IDX_PARTI_RANGE_ID';
 4 
 5  
 6 
 7 INDEX_NAME                     PARTITI PARTITION_COUNT
 8 
 9  ------------------------------ ------- ---------------
10  
11 IDX_PARTI_RANGE_ID             RANGE                 3
12 
13  
14 
15  select partition_name, high_value, tablespace_name
16  from user_ind_partitions
17  where index_name = 'IDX_PARTI_RANGE_ID'
18  order by partition_position;
19 
20  
21 
22 PARTITION_NAME                 HIGH_VALUE TABLESPACE_NAME
23 
24  ------------------------------ ---------- --------------------
25  
26 I_RANGE_P1                     10         TBSPART01
27 
28 I_RANGE_P2                     40         TBSPART02
29 
30 I_RANGE_PMAX                   MAXVALUE   TBSPART03
31 
32  
33

③　Local分区索引的创建最简单，例如：

仍然借助t_partition_range表来创建索引

--首先删除之前创建的global索引

1 drop index IDX_PARTI_RANGE_ID; 
2  -- 索引已删除。
3  create index IDX_PARTI_RANGE_ID on T_PARTITION_RANGE(id) local;
4  -- 索引已创建。

查询相关数据字典：

 1 select index_name, partitioning_type, partition_count
 2  From user_part_indexes
 3  where index_name = 'IDX_PARTI_RANGE_ID';
 4 
 5  
 6 
 7 INDEX_NAME                     PARTITI PARTITION_COUNT
 8 
 9  ------------------------------ ------- ---------------
10  
11 IDX_PARTI_RANGE_ID             RANGE                 4
12 
13  
14 
15  select partition_name, high_value, tablespace_name
16  from user_ind_partitions
17  where index_name = 'IDX_PARTI_RANGE_ID'
18  order by partition_position;
19 
20  
21 
22 PARTITION_NAME                 HIGH_VALUE TABLESPACE_NAME
23 
24  ------------------------------ ---------- --------------------
25  
26 T_RANGE_P1                     10         TBSPART01
27 
28 T_RANGE_P2                     20         TBSPART02
29 
30 T_RANGE_P3                     30         TBSPART03
31 
32 T_RANGE_PMAX                   MAXVALUE   TBSPART04
33 
34

可以看出，local索引的分区完全继承表的分区的属性，包括分区类型，分区的范围值即不需指定也不能更改，这就是前面说的：local索引的分区维护完全依赖于其索引所在表。

不过呢分区名称，以及分区所在表空间等信息是可以自定义的，例如：

 1 create index IDX_PART_RANGE_ID ON T_PARTITION_RANGE(id) local (
 2 partition i_range_p1 tablespace tbspart01,
 3 partition i_range_p2 tablespace tbspart01,
 4 partition i_range_p3 tablespace tbspart02,
 5 partition i_range_pmax tablespace tbspart02
 6 );
 7 -- 索引已创建。
 8 select index_name, partitioning_type, partition_count
 9 From user_part_indexes
10 where index_name = 'IDX_PART_RANGE_ID';
11 
12  
13 INDEX_NAME                     PARTITI PARTITION_COUNT
14 
15 ------------------------------ ------- ---------------
16 
17 IDX_PART_RANGE_ID              RANGE                 4
18 
19  
20 
21 select partition_name, high_value, tablespace_name
22 from user_ind_partitions
23 where index_name = 'IDX_PART_RANGE_ID'
24 order by partition_position;
25 
26 PARTITION_NAME  HIGH_VALUE      TABLESPACE_NAME
27 
28 --------------- --------------- --------------------
29 
30 I_RANGE_P1      10              TBSPART01
31 
32 I_RANGE_P2      20              TBSPART01
33 
34 I_RANGE_P3      30              TBSPART02
35 
36 I_RANGE_PMAX    MAXVALUE        TBSPART02
37 
38  
39

创建hash分区

语法如下：

语法看起来比range复杂，其实使用起来比range更简单，这里需要我们指定的有：

l column:分区依赖列(支持多个，中间以逗号分隔);

l partition:指定分区，有两种方式：

n 直接指定分区名，分区所在表空间等信息

n 只指定分区数量，和可供使用的表空间。

①　创建hash分区表

 1 create table t_partition_hash (
 2 id number,
 3 name varchar2(50)
 4 )
 5 partition by hash(id)(
 6    partition t_hash_p1 tablespace tbspart01, 
 7    partition t_hash_p2 tablespace tbspart02,
 8    partition t_hash_p3 tablespace tbspart036 
 9 );
10 
11 -- 表已创建。

要实现同样效果，你还可以这样：

 1 create table t_partition_hash2 (
 2   id number,
 3   name varchar2(50)
 4 )
 5 partition by hash(id)
 6  partitions 3 store in(tbspart01,tbspart02,tbspart03
 7 );
 8 
 9 -- 表已创建。
10

这就是上面说的，直接指定分区数量和可供使用的表空间。

提示：这里分区数量和可供使用的表空间数量之间没有直接对应关系。分区数并不一定要等于表空间数。

要查询表的分区信息，仍然是通过user_part_tables,user_tab_partitions两个数据字典，这里不再举例。

②　Global索引hash分区

Hash分区索引的子句与hash分区表的创建子句完全相同，例如：

1 create index idx_part_hash_id on t_partition_hash(id)
2 global partition by hash(id)
3 partitions 3 store in(tbspart01,tbspart02,tbspart03);
4 
5 --索引已创建。
6

查询索引的分区信息也仍是通过user_part_indexes、user_ind_partitions两个数据字典，不再举例。

③　创建Local索引

在前面学习range分区时，我们已经对Local索引的特性做了非常清晰的概述，因此这里也不再举例，如有疑问，建议再仔细复习range分区的相关示例，如果还有疑问，当面问我好了:)

综上：

Ø 对于global索引分区而言，在10g中只能支持range分区和hash分区，因此后续示例中不会再提及。

Ø 对于local索引分区而言，其分区形式完全依赖于索引所在表的分区形式，不管从创建语法还是理解难度均无技术含量，因此后续也不再提供示例。

Ø 注意，在创建索引时如果不显式指定global或local，则默认是global。

Ø 注意，在创建global索引时如果不显式指定分区子句，则默认不分区(废话)。

posted @ 2010-05-21 10:05 猪也有理想阅读(1022) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部