Oracle undo我们需要掌握什么

《Oracle undo我们需要掌握什么》

引言：undo 是Oracle数据库的重要组件，刚入门的朋友建议要把undo的原理和机制理解明白，尤其是和redo组件的区别和联系。了解undo就相当于对oracle恢复有了一半的理解。下面我们开始学习Oracle undo需要掌握什么！

更多的精彩文章请垂询 www.leonarding.com blog，欢迎大家来探讨交流

“分享技术~成就梦想”

一 大话UNDO

      Hi 大家好，我是Oracle 的无敌小安[中文名（small undo[英文名），首先我先来介绍一下自己吧，我诞生于一个大家庭Oracle，现在的一把手拉里.埃里森就是我的缔造者，我的诞生可谓Oracle立下了汗马功劳，使Oracle开拓缰野攻城略地！我的诞生是为了解决三个大问题，事物回滚，实例恢复，查询一致性。这样的功能使Oracle成为了关系型数据库中的佼佼者。

例如：读不会被写所阻塞，当我们读取的数据块正好被他人修改时，我们就可以找到undo段里保存的前映像来维护一致性。而其他数据库，sql server  mysql等都没有undo段，也就是说它们查询时可能被阻塞。

Undo和Redo区别

好多人尤其是刚刚入门的朋友，总会把这两个概念搞混淆。

Redo：是基于安全考虑的，会记录数据库的所有变化，当数据被误修改时，使用redo可重新生成，事物重做。是前滚，就是从无到有的新创建。一个新生命的诞生。

Undo：是基于回滚的，当数据被误修改时，可以从修改的新状态回退到老状态，实现事物回滚，相当于撤销操作。是回滚，就像倒录音带一样，把走过的路反向在走一遍回到原点。

Undo目的：1.事物回滚：rollback

           2.实例的恢复：掉电，死机，强制关库，把没有提交的事物全部回滚

           3.查询一致性：读不会被写所阻塞

Undo段：采用LRU最近最少使用算法来循环覆盖使用，它的块有active和inactive和new状态，如果块的状态为inactive那么后续的数据就可以覆盖它了。如果空间不够Oracle自动分配新空间。

分配：Oracle是按顺序循环使用的，不允许跨区覆盖。

回收：Oracle也是按顺序回收的，不允许跨区回收。

Rollback和Commit标识位都一样，都代表事物的结束

Rollback：表示会回滚从上一次提交到现在的所有事物


二 数据库版本

SYS@LEO1> select * from v$version;

BANNER

--------------------------------------------------------------------------------

Oracle Database 11g Enterprise Edition Release 11.2.0.1.0 - 64bit Production

PL/SQL Release 11.2.0.1.0 - Production

CORE    11.2.0.1.0      Production

TNS for Linux: Version 11.2.0.1.0 - Production

NLSRTL Version 11.2.0.1.0 - Production


三 示例演示回滚是否产生REDO日志。

原理解释：首先向大家明确一点，redo的产生机理是因为底层数据块的变化而产生的，这个数据块不管是数据文件的还是undo文件的，数据块的变化都会记录在redo日志里面。

OK我们再来看看undo回滚的原理，假设 一个数据块命名为A，这个A里面存放了数据1，现在我们要把这个1->修改->2->修改->3->修改->2->修改->1 步骤

1.先把1复制一份映像存放到undo块上用于回滚，这就是前映像，undo块改变产生redo记录

2.再把数据块上的1修改为2，A改变产生redo记录，现在A中存放的是2

LEO1@LEO1> drop table leo2 purge;                              清理环境

Table dropped.

LEO1@LEO1> create table leo2 as select * from leo1 where rownum<10; 创建leo2表只需要9行记录即可

LEO1@LEO1> select a.name,b.value from v$statname a,v$mystat b where a.STATISTIC# =b.STATISTIC# and a.NAME='redo size';

NAME                                                             VALUE

-----------------------------------------------------------------------------------------------------------------------------------

redo size                                                           2362280

这是初始化的值

LEO1@LEO1> update leo2 set object_id=2 where object_id=1;     1->修改->2

1 row updated.

LEO1@LEO1> select a.name,b.value from v$statname a,v$mystat b where a.STATISTIC# =b.STATISTIC# and a.NAME='redo size';

NAME                                                             VALUE

---------------------------------------------------------------------------------------------------------------------------------------------

redo size                                                           2362992

LEO1@LEO1> select 2362992-2362280 from dual;           这是产生的redo量

2362992-2362280

-------------------------

3.这时我们又想把2修改为3，还是先把2复制一份映像存放到undo块上用于回滚，这就是第二个前映像，undo块改变产生redo记录

4.再把A中的2修改为3，A改变产生redo记录，现在A中存放的是3

LEO1@LEO1> update leo2 set object_id=3 where object_id=2;      2->修改->3

1 row updated.

LEO1@LEO1> select a.name,b.value from v$statname a,v$mystat b where a.STATISTIC# =b.STATISTIC# and a.NAME='redo size';

NAME                                                             VALUE

-------------------------------------------------------------------------------------------------------------------------------------------

redo size                                                           2363348

LEO1@LEO1> select 2363348-2362992 from dual;       这是产生的redo量

2363348-2362992

---------------------------

5.我们又想把3回退为1，那么就需要先把3回退为2，由于我们在undo段上记录了每次改变的前映像，我们直接把前映像回滚回来即可（事物的回滚），使用第二个前映像把A中的3修改为2，A改变会产生redo记录，现在A中存放的是2，因此这种回滚操作也会产生redo日志的，在使用第一个前映像把A中的2修改为1，A改变会产生redo记录，现在A中存放的是1，此时rollback操作完毕事务结束。

我们用语句来实现一下上面的操作，rollback特点会回滚从上次提交到现在的所有事务，3->1

LEO1@LEO1> rollback;                                 3->修改->2->修改->1

Rollback complete.

LEO1@LEO1> select a.name,b.value from v$statname a,v$mystat b where a.STATISTIC# =b.STATISTIC# and a.NAME='redo size';

NAME                                                             VALUE

---------------------------------------------------------------------------------------------------------------------------------------

redo size                                                           2364608

LEO1@LEO1> select 2364608-2363348 from dual;    产生的redo量很大的

2364608-2363348

------------------------

小结：我们要知道rollback和commit的标识位都一样都代表事务结束，同时也都会产生redo日志。


四 示例演示为数据库创建一个新的UNDO表空间。

Oracle 8i 需要手工创建undo表空间

Oracle 9i 自动管理UNDO表空间

Oracle 10g 11g 在创建数据库时，必须一起创建undo表空间

未来自动化是大趋势，Oracle 12c会更加的自动化 更加的智能

SYS@LEO1> show parameter undo

NAME                  TYPE      VALUE

------------------------------------ ----------- ------------------------------

undo_management       string      AUTO      Oracle自动管理表空间

undo_retention          integer     900        默认保留期15分钟

undo_tablespace         string      UNDOTBS1  Oracle默认undo表空间

SYS@LEO1> select tablespace_name,autoextensible from dba_data_files;

TABLESPACE_NAME                AUT

-------------------------------------------------------------

USERS                           YES

UNDOTBS1                       YES         这也显示当前使用的undo表空间

SYSAUX                          YES

SYSTEM                          YES

LEO1                             NO

Oracle 特点：可以创建好多个undo表空间，但只能使用其中一个，下面我们来创建一个新undo

SYS@LEO1> select tablespace_name,file_name,bytes/1024/1024,autoextensible from dba_data_files;

TABLESPACE_NAME   FILE_NAME                            BYTES/1024/1024   AUT

----------------------------------------------------------------------------------------------------------------------------------------------

USERS             /u01/app/oracle/oradata/LEO1/users01.dbf   5                YES

UNDOTBS1         /u01/app/oracle/oradata/LEO1/undotbs01.dbf 165              YES

SYSAUX            /u01/app/oracle/oradata/LEO1/sysaux01.dbf  610              YES

SYSTEM            /u01/app/oracle/oradata/LEO1/system01.dbf  700              YES

LEO1              /u01/app/oracle/oradata/LEO1/leo1_01.dbf    400              NO

这是所有表空间文件路径和大小，当前undo表空间165M，我们把新的设置成100M

SYS@LEO1> create undo tablespace undotbs2 datafile '/u01/app/oracle/oradata/LEO1/undotbs02.dbf' size 100M;

Tablespace created.

UNDOTBS2         /u01/app/oracle/oradata/LEO1/undotbs02.dbf    100             NO

为什么设置成100M呢，这个大小因人而异，你可以根据自己系统的情况个性化设计满足需求即可。

SYS@LEO1> alter system set undo_tablespace=undotbs2;如果要使用新的undo表空间，必须切换到该表空间

System altered.

SYS@LEO1> show parameter undo

NAME                  TYPE      VALUE

------------------------------------ ----------- ------------------------------

undo_management       string      AUTO      Oracle自动管理表空间

undo_retention          integer     900        默认保留期15分钟

undo_tablespace         string      UNDOTBS2  成为新的默认undo表空间

小结：1.undo是一个很重要的表空间，一个数据库当且仅当只有一个undo表空间，如果我们想使用新的，必须切换到新表空间。

      2.我们不能删除当前正在使用的undo表空间，如果删除了数据库就会crash，如果发现空间太小或者undo段出现坏块，你必须先创建一个新的，再从老的切换过去。


五 示例分别说明什么是consistent read和current read?

一致性读这个话题由来已久，通俗的说一致性读，就是你什么时候发出select，不管查询了多长时间，返回的值都应该是你查询时刻时间点的。这个话题是由业务特性所引起的，是基于业务需求而来的，Oracle中由SCAN号顺序来实现

例如我们查询一张leo1表

LEO1@LEO1> drop table leo1 purge;                      清理环境

Table dropped

LEO1@LEO1> create table leo1 as select * from dba_objects;  创建leo1表

Table created.

LEO1@LEO1> set time on                               我们启动时间点显示

09:44:38 LEO1@LEO1> set autotrace traceonly

09:44:50 LEO1@LEO1> select * from leo1 where object_type='TABLE';  我们看一下执行计划

2818 rows selected.

Execution Plan

----------------------------------------------------------

Plan hash value: 2716644435

--------------------------------------------------------------------------

| Id  | Operation         | Name | Rows  | Bytes | Cost (%CPU)| Time     |

--------------------------------------------------------------------------

|   0 | SELECT STATEMENT  |      |  3003 |   607K|   287   (1)| 00:00:04 |

|*  1 |  TABLE ACCESS FULL| LEO1 |  3003 |   607K|   287   (1)| 00:00:04 |

--------------------------------------------------------------------------

Predicate Information (identified by operation id):

---------------------------------------------------

   1 - filter("OBJECT_TYPE"='TABLE')

Note

-----

   - dynamic sampling used for this statement (level=2)

Statistics

----------------------------------------------------------

          0  recursive calls

          0  db block gets

       1218  consistent gets

          0  physical reads

          0  redo size

     149962  bytes sent via SQL*Net to client

       2580  bytes received via SQL*Net from client

        189  SQL*Net roundtrips to/from client

          0  sorts (memory)

          0  sorts (disk)

       2818  rows processed

09:45:04 LEO1@LEO1>

我们从09:44:50发出select语句，到查询到结果是09:45:04，中间经过了14秒，如果这14秒内有另外的用户去修改我们查询的数据块，那么得到的结果是修改后的呢，还是修改前的呢，从业务的角度看，我们查询的是09:44:50的select，那么不管查了多长时间，我们就想要这个时间点的结果，即查什么时候的就得到什么时候的结果就叫一致性读。

一致性读解决方案：就利用到了回滚段，当我们查询时发现这个数据块正在被修改，那么我们就要跳到回滚段上去读取它的前映像，结果不会因为块修改而改变。这就是著名的“读不会被写所阻塞定理”

Select统计信息里反应出的一致性读

0  db block gets              当前读0个块

1218  consistent gets          一致性读1218个块

当前读，什么是当前读，当前读就是我们操作的数据块一定是最当前的状态，这就会产生锁，防止多个会话同时操作一个数据块，谁先获得块谁就拥有修改权，其他会话就要等待。

例如我们修改一张leo1表

10:13:24 LEO1@LEO1> update leo1 set object_type='leonarding' where object_type='TABLE';

2818 rows updated.

Execution Plan

----------------------------------------------------------

Plan hash value: 3524047104

---------------------------------------------------------------------------

| Id  | Operation          | Name | Rows  | Bytes | Cost (%CPU)| Time     |

---------------------------------------------------------------------------

|   0 | UPDATE STATEMENT   |      |    12 |   132 |   287   (1)| 00:00:04 |

|   1 |  UPDATE            | LEO1 |       |       |            |          |

|*  2 |   TABLE ACCESS FULL| LEO1 |    12 |   132 |   287   (1)| 00:00:04 |

---------------------------------------------------------------------------

Predicate Information (identified by operation id):

---------------------------------------------------

   2 - filter("OBJECT_TYPE"='TABLE')

Note

-----

   - dynamic sampling used for this statement (level=2)

Statistics

----------------------------------------------------------

        285  recursive calls

      12121  db block gets

       3126  consistent gets

         13  physical reads

    2273320  redo size

        837  bytes sent via SQL*Net to client

        825  bytes received via SQL*Net from client

          3  SQL*Net roundtrips to/from client

          6  sorts (memory)

          0  sorts (disk)

       2818  rows processed

10:13:27 LEO1@LEO1>

我们从10:13:24发出update语句，到修改完是10:13:27，中间经过了3秒，这期间都是锁定状态，别的会话必须等待，如果修改完后我一直不提交，这些数据块就都是锁定的，此时如果有其他会话来查询这些数据块的内容，那么就要从回滚段里读取前映像数据了，不允许直接查看数据块当前的状态，因为新修改的数据还没有提交，事物还没有结束。

update统计信息里反应出的当前读

12121  db block gets              当前读12121个块，说明锁定了这么多个块

3126  consistent gets             一致性读相对就少很多

小结：这就是undo segment在consistent read和current read方式下的运作机制。


六 示例演示一个导致ora-01555错误的场景

Ora-01555经典中的经典，直到现在Oracle还是没有完美解决，既然oracle使用到了回滚段来保证读一致性，有利必有弊，那么就会有快照太旧的情况发生，我们所查询的前映像被无情的覆盖了。

原因：就是当一个select查询等待时间太长，这个过程中查询的数据被修改完毕commit了，此时它的前映像就为inactive状态，如果这时候有其他会话也想用undo段，就会把inactive状态的回滚区覆盖掉，这时正好select查询完毕想读取它的前映像，发现已经被覆盖了，此时oracle会报ora-01555错误。理解原理很重要

我用一种叫做闪回查询的功能来实现ora-01555

flashback query:原理也是使用undo segment中的前映像，来查询出我们修改之前的数据映像，一般用于误操作恢复。可以基于时间闪回还可以基于SCN号闪回，一秒钟包括好几个SCN号，不管基于什么oracle内部都是按照SCN号顺序操作的。只要我们查找的原映像被覆盖了，就会报ora-01555错误。

实验

LEO1@LEO1> drop table leo3 purge;                              清理环境

Table dropped.

LEO1@LEO1> create table leo3 (name varchar2(20),sale number);       创建leo3

Table created.

这个表里记录下面4位小朋友去米国游玩的旅行费

LEO1@LEO1> insert into leo3 values('leonarding',10000);

1 row created.

LEO1@LEO1> insert into leo3 values('sunev_yu',20000);

1 row created.

LEO1@LEO1> insert into leo3 values('alan',30000);

1 row created.

LEO1@LEO1> insert into leo3 values('tigerfish',40000);

1 row created.

LEO1@LEO1> commit;

Commit complete.

看样子tiger最有钱了，跟着tiger走吃喝全都有！

LEO1@LEO1> select * from leo3;

NAME                       SALE

----------------------------------------------------------

leonarding                   10000

sunev_yu                    20000

alan                        30000

tigerfish                     40000

先查一下还没有ship之前的SCN号备用

LEO1@LEO1> select dbms_flashback.get_system_change_number scn from dual;

SCN

-----------------

由于tiger的慷慨大方包吃包住，我们玩耍的很尽兴！在结束旅行之前大家去银行查一查每个人的cash book

LEO1@LEO1> update leo3 set sale=100 where name='tigerfish';

1 row updated.

LEO1@LEO1> update leo3 set sale=200 where name='alan';

1 row updated.

LEO1@LEO1> update leo3 set sale=300 where name='sunev_yu';

1 row updated.

LEO1@LEO1> update leo3 set sale=400 where name='leonarding';

1 row updated.

LEO1@LEO1> commit;

Commit complete.

哈 发现一个规律现金越少蹭功越强，在此向tigerfish  alan两位大师表达敬意！欧巴~阿加西~

LEO1@LEO1> select * from leo3;

NAME                       SALE

----------------------------------------------------------

leonarding                   400

sunev_yu                    300

alan                        200

tigerfish                     100

LEO1@LEO1> select dbms_flashback.get_system_change_number scn from dual;

SCN

----------------

看SCN：2595945~增长~2605429，记录着数据库所有变化，是持续增长的

这时他们都想看看来时每个人的现金额是多少，花了多少，回去好交差

LEO1@LEO1> select name,sale from leo3 as of scn 2595945;

NAME                       SALE

----------------------------------------------------------

leonarding                   10000

sunev_yu                    20000

alan                        30000

tigerfish                     40000

这些数据，就是从undo segment中读取出来的，我们需要指定当时的SCN号，我们要根据SCN号进行闪回查询。

LEO1@LEO1> alter database datafile '/u01/app/oracle/oradata/LEO1/undotbs02.dbf' autoextend off;

Database altered.

禁用undo表空间自动扩展功能

LEO1@LEO1> select tablespace_name,file_name,autoextensible from dba_data_files where tablespace_name='UNDOTBS2';

TABLESPACE_NAME   FILE_NAME                                  AUT

----------------------------------------------------------------------------------------------------------------------------------------------

UNDOTBS2          /u01/app/oracle/oradata/LEO1/undotbs02.dbf      NO

我们现在开始覆盖undo segment中的inactive区中前映像，覆盖之后我们再查询时就会出现ora-01555

LEO1@LEO1> begin

for i in 1..100000 loop

update leo3 set sale=10000 where sale>=100;

rollback;

end loop;

end;

  2    3    4    5    6    7

PL/SQL procedure successfully completed.

经典中的经典出现了ORA-01555

LEO1@LEO1> select name,sale from leo3 as of scn 2595945;

select name,sale from leo3 as of scn 2595945

ERROR at line 1:

ORA-01555: snapshot too old: rollback segment number 12 with name "_SYSSMU12_3331027169$" too small

ORA-01555：快照太旧：名为_SYSSMU12_3331027169$的12号回滚段太小，哈~我们成功模拟出undo segment被覆盖场景。

小结：上述实验说明了undo分配是按顺序循环使用，不可跨区覆盖，undo回收也是按顺序循环回收，不可跨区回收。

undo，redo，consistent read，current read，ORA-01555

posted @ 2013-10-03 20:39 胡.杰阅读(401) 评论(0) 收藏举报

刷新页面返回顶部

Oracle undo我们需要掌握什么

公告