博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

Oracle表分区和索引分区汇总

Posted on 2008-04-29 23:35  徐正柱-  阅读(3340)  评论(0编辑  收藏  举报
分区概述

    为了简化数据库大表的管理,例如在数据仓库中一般都是TB级的数量级.ORACLE8以后推出了分区选项.分区将表分离在若于不同的表空间上,用分而治之的方法来支撑元限膨胀的大表,组大表在物理一级的可管理性.将大表分割成较小的分区可以改善表的维护、备份、恢复、事务及查询性能。

分区的优点:

1、 增强可用性:如果表的一个分区由于系统故障而不能使用,表的其余好的分区仍可以使用;

2、 减少关闭时间:如果系统故障只影响表的一部份分区,那么只有这部份分区需要修复,就能比整个大表修复花的时间更少;

3、 维护轻松:如果需要得建表,独立管理每个分区比管理单个大表要轻松得多;

4、 均衡I/O:可以把表的不同分区分配到不同的磁盘来平衡I/O改善性能;

5、 改善性能:对大表的查询、增加、修改等操作可以分解到表的不同分区来并行执行,可使运行速度更快,在数据仓库的TP查询特别有用。

6、 分区对用户透明,最终用户感觉不到分区的存在。

 

create tablespace dw1

datafile 'D:"oracle"oradata"ora9"dw11.ora' size 50M

 

create tablespace dw2

datafile 'D:"oracle"oradata"ora9"dw21.ora' size 50M

一、按范围分区:固名思义就是按一定range来分区,看下面的例子:

SQL> set linesize 1000

SQL> create table niegc_part

 2 (

 3 part_id integer primary key,

 4 part_date date,

 5 part_dec varchar2(100)

 6 )

 7 partition by range(part_date)

  8 (

 9 partition part_01 values less than(to_date('2006-01-01','yyyy-mm-dd')) tablespace dw1,

 10 partition part_02 values less than(to_date('2007-01-01','yyyy-mm-dd')) tablespace dw2,

 11 partition part_03 values less than(maxvalue) tablespace dw1

 12 );

表已创建。

SQL>

SQL> insert into niegc_part values(1,to_date('2005-12-30','yyyy-mm-dd'),'less 20

06-01-01');

已创建 1 行。

SQL> commit;

提交完成。

SQL> insert into niegc_part values(2,to_date('2006-01-01','yyyy-mm-dd'),'equal 2

007-01-01');

已创建 1 行。

SQL> commit;

提交完成。

SQL> insert into niegc_part values(3,sysdate,'sysdate');

已创建 1 行。

SQL> commit;

提交完成。

SQL>

SQL>

SQL> select * from niegc_part partition(part_01);

   PART_ID PART_DATE PART_DEC

---------- ---------- ----------------------------------------------------------

         1 30-12-05 less 2006-01-01

SQL>

 

相信只要对oracle 有点熟,都能知道上面的range分区的意思了.

两个字段以上的range分区大同小异,请看下面的例子:

create table niegc_part
(
part_id integer primary key,
part_date date,
part_dec varchar2(100)
)
partition by range(part_id,part_date)
(
partition part_01 values less than(1,to_date('2006-01-01','yyyy-mm-dd')) tablespace dw,
partition part_02 values less than(10,to_date('2007-01-01','yyyy-mm-dd')) tablespace dw,
partition part_03 values less than(maxvalue,maxvalue) tablespace dw
);
 

二、Hash分区(散列分区)散列分区通过指定分区编号来均匀分布数据的一种分区类型,因为通过在I/O设备上进行散列分区,使行这些分区大小一致。如将part_id的数据根据自身的情况散列地存放在指定的三个表空间中:

createtableniegc_part

(

part_id integerprimarykey,

part_date date,

part_dec varchar2(100)

)

partitionbyhash(part_id)

(

partition part_01 tablespace dw1,

partition part_02 tablespace dw2

);

系统将按part_id将记录散列地插入三个分区中,这里也就是二个不同的表空间中。

 

三、复合分区。根据范围分区后,每个分区内的数据再散列地分布在几个表空间中,这样我们就要使用复合分区。复合分区是先使用范围分区,然后在每个分区同再使用散列分区的一种分区方法,如将part_date的记录按时间分区,然后每个分区中的数据分三个子分区,将数据散列地存储在三个指定的表空间中:

 

createtableniegc_part

(

part_id integerprimarykey,

part_date date,

part_dec varchar2(100)

)

partition by range(part_date)subpartition by hash(part_id)

subpartitions2 store in(dw1,dw2)

(

partition part_01 valueslessthan(to_date('2006-01-01','yyyy-mm-dd'))tablespace dw1,

partition part_02 valueslessthan(to_date('2007-01-01','yyyy-mm-dd'))tablespace dw2,

partition part_03 valueslessthan(maxvalue)tablespace dw1

);

 

先根据part_date进行范围分区,然后根据交易的ID将记录散列地存储在二个表空间中。

 

四、索引分区:

注意:对某个字段已做了分区了,是不允许再建立索引分区的。这一点要非常注意。

 

全局索引建立时global子句允许指定索引的范围值,这个范围值为索引字段的范围值:

create index idx_part_id onniegc_part(part_dec)

global partition by range(part_dec)

(

partition idx_1 valueslessthan('1000')tablespace dw,

partition idx_2 valueslessthan(maxvalue)tablespace dw

)

 

局部索引分区的建立:(注意:表必须存在分区,此分区的个数必须和分区表的分区个数一样,不然是建立不起来的)

createindex idx_part_id onniegc_part(part_dec)

local

(

partition idx_1 tablespace dw1,

partition idx_2 tablespace dw2

)

 

五、分区维护:(只对范围分区)

1)、增加一个分区:分区范围只能往上增,不能增加一个少于原有的分区:

altertableniegc_partaddpartition part_03 valueslessthan(maxvalue)

2)、合并分区:(合并后的分区必须指下最后一个大value的分区)

altertableniegc_partmergepartitions part_02,part_03 into partition part_03

3)、删除一个分区:

altertableniegc_partdroppartition part_01

六、总结:

一、按范围分区:固名思义就是按一定range来分区,看下面的例子:

SQL> set linesize 1000

SQL> create table niegc_part

 2 (

 3 part_id integer primary key,

 4 part_date date,

 5 part_dec varchar2(100)

 6 )

 7 partition by range(part_date)

  8 (

 9 partition part_01 values less than(to_date('2006-01-01','yyyy-mm-dd')) tablespace dw1,

 10 partition part_02 values less than(to_date('2007-01-01','yyyy-mm-dd')) tablespace dw2,

 11 partition part_03 values less than(maxvalue) tablespace dw1

 12 );

表已创建。

SQL>

SQL> insert into niegc_part values(1,to_date('2005-12-30','yyyy-mm-dd'),'less 20

06-01-01');

已创建 1 行。

SQL> commit;

提交完成。

SQL> insert into niegc_part values(2,to_date('2006-01-01','yyyy-mm-dd'),'equal 2

007-01-01');

已创建 1 行。

SQL> commit;

提交完成。

SQL> insert into niegc_part values(3,sysdate,'sysdate');

已创建 1 行。

SQL> commit;

提交完成。

SQL>

SQL>

SQL> select * from niegc_part partition(part_01);

   PART_ID PART_DATE PART_DEC

---------- ---------- ----------------------------------------------------------

         1 30-12-05 less 2006-01-01

SQL>

 

相信只要对oracle 有点熟,都能知道上面的range分区的意思了.

两个字段以上的range分区大同小异,请看下面的例子:

create table niegc_part
(
part_id integer primary key,
part_date date,
part_dec varchar2(100)
)
partition by range(part_id,part_date)
(
partition part_01 values less than(1,to_date('2006-01-01','yyyy-mm-dd')) tablespace dw,
partition part_02 values less than(10,to_date('2007-01-01','yyyy-mm-dd')) tablespace dw,
partition part_03 values less than(maxvalue,maxvalue) tablespace dw
)

 ENABLE ROW MOVEMENT  ----可选
;
 

二、Hash分区(散列分区)散列分区通过指定分区编号来均匀分布数据的一种分区类型,因为通过在I/O设备上进行散列分区,使行这些分区大小一致。如将part_id的数据根据自身的情况散列地存放在指定的三个表空间中:

create table niegc_part

(

part_id integerprimarykey,

part_date date,

part_dec varchar2(100)

)

partition by hash(part_id)

(

partition part_01 tablespace dw1,

partition part_02 tablespace dw2

)

 ENABLE ROW MOVEMENT  ----可选
;

系统将按part_id将记录散列地插入三个分区中,这里也就是二个不同的表空间中。

  

三、复合分区。根据范围分区后,每个分区内的数据再散列地分布在几个表空间中,这样我们就要使用复合分区。复合分区是先使用范围分区,然后在每个分区同再使用散列分区的一种分区方法,如将part_date的记录按时间分区,然后每个分区中的数据分三个子分区,将数据散列地存储在三个指定的表空间中:

 

create table niegc_part

(

part_id integerprimary key,

part_date date,

part_dec varchar2(100)

)

partition by range(part_date)subpartition by hash(part_id)

subpartitions2storein(dw1,dw2)

(

partition part_01 values less than(to_date('2006-01-01','yyyy-mm-dd'))tablespace dw1,

partition part_02 values less than(to_date('2007-01-01','yyyy-mm-dd'))tablespace dw2,

partition part_03 values less than(maxvalue)tablespace dw1

)

 ENABLE ROW MOVEMENT
;

 

先根据part_date进行范围分区,然后根据交易的ID将记录散列地存储在二个表空间中。

 

四、索引分区:

注意:对某个字段已做了分区了,是不允许再建立索引分区的。这一点要非常注意。

 

全局索引建立时global子句允许指定索引的范围值,这个范围值为索引字段的范围值:

create index idx_part_id on niegc_part(part_dec)

globalpartitionbyrange(part_dec)

(

partition idx_1 values less than('1000')tablespace dw,

partition idx_2 values less than(maxvalue)tablespace dw

)

 

局部索引分区的建立:(注意:表必须存在分区,此分区的个数必须和分区表的分区个数一样,不然是建立不起来的)

create index idx_part_id on niegc_part(part_dec)

local

(

partition idx_1 tablespace dw1,

partition idx_2 tablespace dw2

)

 

五、分区维护:(只对范围分区)

1)、增加一个分区:分区范围只能往上增,不能增加一个少于原有的分区:

alter table niegc_part add partition part_03 values less than(maxvalue)

2)、合并分区:(合并后的分区必须指下最后一个大value的分区)

alter table niegc_part merge partitions part_02,part_03 into partition part_03

3)、删除一个分区:

alter table niegc_part drop partition part_01

六、总结:

分区表是将大表的数据分成称为分区的许多小的子集,9i提供四种分区方法:列表分区,范围分区,哈希分区和混合分区;

1.范围分区是根椐分区键的不同取值范围来划分子集的,关键字RANGE, VALUES LESS THAN;
    2.列表分区是根椐分区键的一些离散的取值来划分子集的,关键字LIST, VALUES;
    3.哈希分区是应用哈希算法将分区键对应到某个子集中去,关键字HASH, PARTITIONS;
    4.混合分区只能有两层,第一层是范围分区,第二层可以是列表分区或者哈希分区;
    5.范围分区和列表分区中,如果插入记录的分区键没有对应的容纳分区,会产生ORA-14400;   
    6.update操作如果会使记录从一个分区迁移到另一个分区,且分区表的ROW MOVEMENT属性是
DISENABLE,会产生ORA-14402解决办法:alter table 表名 enable row movement; 
    7.分区表上的索引有两大类:普通的二叉树索引,分区索引,下面讲到的都是分区索引:
    8.按索引分区和表分区间的对应关系可以分为局部索引和全局索引;
    9.局部索引的索引分区和表分区间是一一对应的,全局索引则相反;
    10.局部索引的分区方法可以用上面提到四种的任何一种,全局索引的分区方法只有范围分区(而且最高的

   分区必须用MAXVALUE来定义); 
    11.ORACLE自动维护局部索引的分区,当表分区被合并,分裂或删除时,关联的索引分区也会被合并,分裂

   或删除;对分区表执行管理操作时会使其上的全局索引失效;
    12.建在分区表的位图索引必须是局部分区索引;
    13.ORACLE推荐尽可能地使用局部索引;
    14.按索引栏位和分区键间的关系分为前缀索引和非前缀索引;
    15.前缀索引最前面的栏位是分区键栏位,非前缀索引相反;
    16.在这两带来很多选项,如分区排除,并行分区连接等。