深入学习分区表及分区索引

前言:

这篇文章的来源是来自我的csdn上面的一个帖子,

欢迎大家前来拍砖

oracle 大数据查询优化的方案

http://topic.csdn.net/u/20100520/10/3dfeada0-0f2a-4250-9433-34a0c18558af.html 

 

关于分区表分区索引(About Partitioned Tables and Indexes)

 

 

对于10gR2而言,基本上可以分成几类:

v Range(范围)分区

v Hash(哈希)分区

v List(列表)分区

v 以及组合分区:Range-Hash,Range-List。

 

 

 

对于表而言(常规意义上的堆组织表),上述分区形式都可以应用(甚至可以对某个分区指定compress属性),只不过分区依赖列不能是lob,long之类数据类型,每个表的分区或子分区数的总数不能超过1023个。

对于索引组织表,只能够支持普通分区方式,不支持组合分区,常规表的限制对于索引组织表同样有效,除此之外呢,还有一些其实的限制,比如要求索引组织表的分区依赖列必须是主键才可以等。

注:本篇所有示例仅针对常规表,即堆组织表!

 

对于索引,需要区分创建的是全局索引,或本地索引:

l 全局索引(global index):即可以分区,也可以不分区。即可以建range分区,也可以建hash分区,即可建于分区表,又可创建于非分区表上,就是说,全局索引是完全独立的,因此它也需要我们更多的维护操作。

l 本地索引(local index):其分区形式与表的分区完全相同,依赖列相同,存储属性也相同。对于本地索引,其索引分区的维护自动进行,就是说你add/drop/split/truncate表的分区时,本地索引会自动维护其索引分区。

 

Oracle建议如果单个表超过2G就最好对其进行分区,对于大表创建分区的好处是显而易见的,这里不多论述why,而将重点放在when以及how

 

WHEN

一、When使用Range分区

Range分区呢是应用范围比较广的表分区方式,它是以列的值的范围来做为分区的划分条件,将记录存放到列值所在的range分区中,比如按照时间划分,2008年1季度的数据放到a分区,08年2季度的数据放到b分区,因此在创建的时候呢,需要你指定基于的列,以及分区的范围值,如果某些记录暂无法预测范围,可以创建maxvalue分区,所有不在指定范围内的记录都会被存储到maxvalue所在分区中,并且支持指定多列做为依赖列,后面在讲how的时候会详细谈到。

 

二、When使用Hash分区

通常呢,对于那些无法有效划分范围的表,可以使用hash分区,这样对于提高性能还是会有一定的帮助。hash分区会将表中的数据平均分配到你指定的几个分区中,列所在分区是依据分区列的hash值自动分配,因此你并不能控制也不知道哪条记录会被放到哪个分区中,hash分区也可以支持多个依赖列。

 

三、When使用List分区

List分区与range分区和hash分区都有类似之处,该分区与range分区类似的是也需要你指定列的值,但这又不同与range分区的范围式列值---其分区值必须明确指定,也不同与hash分区---通过明确指定分区值,你能控制记录存储在哪个分区。它的分区列只能有一个,而不能像range或者hash分区那样同时指定多个列做为分区依赖列,不过呢,它的单个分区对应值可以是多个。

你在分区时必须确定分区列可能存在的值,一旦插入的列值不在分区范围内,则插入/更新就会失败,因此通常建议使用list分区时,要创建一个default分区存储那些不在指定范围内的记录,类似range分区中的maxvalue分区。

 

四、When使用组合分区

如果某表按照某列分区之后,仍然较大,或者是一些其它的需求,还可以通过分区内再建子分区的方式将分区再分区,即组合分区的方式。

 

组合分区呢在10g中有两种:range-hash,range-list。注意顺序哟,根分区只能是range分区,子分区可以是hash分区或list分区。

 

提示:11g在组合分区功能这块有所增强,又推出了range-range,list-range,list-list,list-hash,这就相当于除hash外三种分区方式的笛卡尔形式都有了。为什么会没有hash做为根分区的组合分区形式呢,再仔细回味一下第二点,你一定能够想明白~~。

 

创建range分区

HOW

一、如何创建

如果想对某个表做分区,必须在创建表时就指定分区,我们可以对一个包含分区的表中的分区做修改,但不能直接将一个未分区的表修改成分区表(起码在10g是不行的,当然你可能会说,可以通过在线重定义的方式,但是这不是直接哟,这也是借助临时表间接实现的)。

 

创建表或索引的语法就不说了,大家肯定比我还熟悉,而想在建表(索引)同时指定分区也非常容易,只需要把创建分区的子句放到";"前就行啦,同时需要注意表的row movement属性,它用来控制是否允许修改列值所造成的记录移动至其它分区存储,有enable|disable两种状态,默认是disable row movement,当disable时,如果记录要被更新至其它分区,则更新语句会报错。

 

下面分别演示不同分区方式的表和索引的创建:

 

1、创建range分区

 

语法如下,图:

 

需要我们指定的有:

l column:分区依赖列(如果是多个,以逗号分隔);

l partition:分区名称;

l values less than:后跟分区范围值(如果依赖列有多个,范围对应值也应是多个,中间以逗号分隔);

l tablespace_clause:分区的存储属性,例如所在表空间等属性(可为空),默认继承基表所在表空间的属性。

 

① 创建一个标准的range分区表:

 

 

1 create table t_partition_range (
2 id number,
3 name varchar2(50)
4 )
5 partition by range(id)(
6 partition t_range_p1 values less than (10) tablespace tbspart01,
7 partition t_range_p2 values less than (20) tablespace tbspart02,
8 partition t_range_p3 values less than (30) tablespace tbspart03,
9 partition t_range_pmax values less than (maxvalue) tablespace tbspart04
10 );
11
12
13
14  -- 表已创建。
15  

 

 

 

 

要查询创建分区的信息,可以通过查询user_part_tables,user_tab_partitions两个数据字典(索引分区、组织分区等信息也有对应的数据字典,后续示例会逐步提及)。

user_part_tables:记录分区的表的信息;

user_tab_partitions:记录表的分区的信息。

例如:

 

1 select table_name,partitioning_type,partition_count
2 From user_part_tables where table_name='T_PARTITION_RANGE';
3
4
5
6 TABLE_NAME PARTITI PARTITION_COUNT
7
8  ------------------------------ ------- ---------------
9  
10 T_PARTITION_RANGE RANGE 4
11
12
13
14  select partition_name,high_value,tablespace_name
15 from user_tab_partitions where table_name='T_PARTITION_RANGE'
16  order by partition_position;
17
18
19
20 PARTITION_NAME HIGH_VALUE TABLESPACE_NAME
21
22  ------------------------------ ---------- --------------------
23  
24 T_RANGE_P1 10 TBSPART01
25
26 T_RANGE_P2 20 TBSPART02
27
28 T_RANGE_P3 30 TBSPART03
29
30 T_RANGE_PMAX MAXVALUE TBSPART04
31  

 

 

 

 

② 创建global索引range分区:

 

1 create index idx_parti_range_id on t_partition_range(id)global partition by range(id)(
2 partition i_range_p1 values less than (10) tablespace tbspart01,
3 partition i_range_p2 values less than (40) tablespace tbspart02,
4 partition i_range_pmax values less than (maxvalue) tablespace tbspart035
5 );
6
7  -- 索引已创建。

 

 

 

由上例可以看出,创建global索引的分区与创建表的分区语句格式完全相同,而且其分区形式与索引所在表的分区形式没有关联关系。

注意:我们这里借助上面的表t_partition_range来演示创建range分区的global索引,并不表示range分区的表,只能创建range分区的global索引,只要你想,也可以为其创建hash分区的global索引。

 

查询索引的分区信息可以通过user_part_indexes、user_ind_partitions两个数据字典:

 

1 select index_name, partitioning_type, partition_count
2  From user_part_indexes
3  where index_name = 'IDX_PARTI_RANGE_ID';
4
5
6
7 INDEX_NAME PARTITI PARTITION_COUNT
8
9  ------------------------------ ------- ---------------
10  
11 IDX_PARTI_RANGE_ID RANGE 3
12
13
14
15  select partition_name, high_value, tablespace_name
16  from user_ind_partitions
17  where index_name = 'IDX_PARTI_RANGE_ID'
18  order by partition_position;
19
20
21
22 PARTITION_NAME HIGH_VALUE TABLESPACE_NAME
23
24  ------------------------------ ---------- --------------------
25  
26 I_RANGE_P1 10 TBSPART01
27
28 I_RANGE_P2 40 TBSPART02
29
30 I_RANGE_PMAX MAXVALUE TBSPART03
31
32
33  

 

 

 

 

③ Local分区索引的创建最简单,例如:

仍然借助t_partition_range表来创建索引

--首先删除之前创建的global索引

 

 

1 drop index IDX_PARTI_RANGE_ID;
2  -- 索引已删除。
3  create index IDX_PARTI_RANGE_ID on T_PARTITION_RANGE(id) local;
4  -- 索引已创建。

 

 

 

 

查询相关数据字典:

 

1 select index_name, partitioning_type, partition_count
2  From user_part_indexes
3  where index_name = 'IDX_PARTI_RANGE_ID';
4
5
6
7 INDEX_NAME PARTITI PARTITION_COUNT
8
9  ------------------------------ ------- ---------------
10  
11 IDX_PARTI_RANGE_ID RANGE 4
12
13
14
15  select partition_name, high_value, tablespace_name
16  from user_ind_partitions
17  where index_name = 'IDX_PARTI_RANGE_ID'
18  order by partition_position;
19
20
21
22 PARTITION_NAME HIGH_VALUE TABLESPACE_NAME
23
24  ------------------------------ ---------- --------------------
25  
26 T_RANGE_P1 10 TBSPART01
27
28 T_RANGE_P2 20 TBSPART02
29
30 T_RANGE_P3 30 TBSPART03
31
32 T_RANGE_PMAX MAXVALUE TBSPART04
33
34

 

 

可以看出,local索引的分区完全继承表的分区的属性,包括分区类型,分区的范围值即不需指定也不能更改,这就是前面说的:local索引的分区维护完全依赖于其索引所在表。

 

不过呢分区名称,以及分区所在表空间等信息是可以自定义的,例如:

 

1 create index IDX_PART_RANGE_ID ON T_PARTITION_RANGE(id) local (
2 partition i_range_p1 tablespace tbspart01,
3 partition i_range_p2 tablespace tbspart01,
4 partition i_range_p3 tablespace tbspart02,
5 partition i_range_pmax tablespace tbspart02
6 );
7 -- 索引已创建。
8 select index_name, partitioning_type, partition_count
9 From user_part_indexes
10 where index_name = 'IDX_PART_RANGE_ID';
11
12
13 INDEX_NAME PARTITI PARTITION_COUNT
14
15 ------------------------------ ------- ---------------
16
17 IDX_PART_RANGE_ID RANGE 4
18
19
20
21 select partition_name, high_value, tablespace_name
22 from user_ind_partitions
23 where index_name = 'IDX_PART_RANGE_ID'
24 order by partition_position;
25
26 PARTITION_NAME HIGH_VALUE TABLESPACE_NAME
27
28 --------------- --------------- --------------------
29
30 I_RANGE_P1 10 TBSPART01
31
32 I_RANGE_P2 20 TBSPART01
33
34 I_RANGE_P3 30 TBSPART02
35
36 I_RANGE_PMAX MAXVALUE TBSPART02
37
38
39

 

创建hash分区

语法如下:

 

语法看起来比range复杂,其实使用起来比range更简单,这里需要我们指定的有:

l column:分区依赖列(支持多个,中间以逗号分隔);

l partition:指定分区,有两种方式:

n 直接指定分区名,分区所在表空间等信息

n 只指定分区数量,和可供使用的表空间。

 

① 创建hash分区表

 

 

1 create table t_partition_hash (
2 id number,
3 name varchar2(50)
4 )
5 partition by hash(id)(
6 partition t_hash_p1 tablespace tbspart01,
7 partition t_hash_p2 tablespace tbspart02,
8 partition t_hash_p3 tablespace tbspart036
9 );
10
11 -- 表已创建。

 

 

 

 

要实现同样效果,你还可以这样:

 

1 create table t_partition_hash2 (
2 id number,
3 name varchar2(50)
4 )
5 partition by hash(id)
6 partitions 3 store in(tbspart01,tbspart02,tbspart03
7 );
8
9 -- 表已创建。
10

 

 

这就是上面说的,直接指定分区数量和可供使用的表空间。

提示:这里分区数量和可供使用的表空间数量之间没有直接对应关系。分区数并不一定要等于表空间数。

要查询表的分区信息,仍然是通过user_part_tables,user_tab_partitions两个数据字典,这里不再举例。

 

② Global索引hash分区

Hash分区索引的子句与hash分区表的创建子句完全相同,例如:

 

1 create index idx_part_hash_id on t_partition_hash(id)
2 global partition by hash(id)
3 partitions 3 store in(tbspart01,tbspart02,tbspart03);
4
5 --索引已创建。
6

 

 

查询索引的分区信息也仍是通过user_part_indexes、user_ind_partitions两个数据字典,不再举例。

 

 

③ 创建Local索引

在前面学习range分区时,我们已经对Local索引的特性做了非常清晰的概述,因此这里也不再举例,如有疑问,建议再仔细复习range分区的相关示例,如果还有疑问,当面问我好了:)

 

 

综上:

Ø 对于global索引分区而言,在10g中只能支持range分区和hash分区,因此后续示例中不会再提及。

Ø 对于local索引分区而言,其分区形式完全依赖于索引所在表的分区形式,不管从创建语法还是理解难度均无技术含量,因此后续也不再提供示例。

Ø 注意,在创建索引时如果不显式指定global或local,则默认是global。

Ø 注意,在创建global索引时如果不显式指定分区子句,则默认不分区(废话)。

posted @ 2010-05-21 10:05  猪也有理想  阅读(1022)  评论(0编辑  收藏  举报