【Oracle坏块】Oracle坏块介绍 & 坏块类型：ALL ZERO

一、介绍

　　v$DATABASE_BLOCK_CORRUPTION中的CORRUPTION_TYPE有以下几种情况：

　　1、ALL ZERO

　　------磁盘上的块标头仅包含零。如果该块从未填充，并且位于Oracle7文件中，则该块可能有效。对于空块，缓冲区将重新格式化为Oracle8标准。

　　2、FRACTURED

　　------块头看起来合理，但块的前面和后面是不同的版本。

　　3、CHECKSUM

　　------可选检查值显示块不是自一致的。不可能确切地确定检查值失败的原因，但是它可能失败，因为块中间的扇区来自不同的版本。

　　4、CORRUPT

　　------锁被错误识别或不是数据块（例如，数据块地址丢失）。

　　5、LOGICAL

　　------块在逻辑上已损坏。

　　6、NOLOGGING

　　------块没有重做日志项（例如，主数据库上的NOLOGGING操作可能会在物理备用数据库上引入这种类型的损坏）。

二、模拟几种corrupt情况

创建测试表空间和表

SQL> create tablespace test datafile '/u01/app/oracle/oradata/T1/test.dbf' size 32m;

SQL> create table test tablespace test;

SQL> declare
i number;
begin
for i in 1..10000 loop
insert into test values(i,'NB');
end loop;
commit;
end;
/

SQL> alter system flush buffer_cache;

查看TEST表在OS上的物理位置

select dbms_rowid.rowid_relative_fno(rowid) rfn,dbms_rowid.rowid_block_number(rowid) bln,dbms_rowid.rowid_row_number(rowid) rn from test where rownum<=5;

       RFN      BLN          RN
---------- ---------- ----------
        21      131           0
        21      131           1
        21      131           2
        21      131           3
        21      131           4

查看TEST的表空间的信息

SQL> select ts.ts#,df.file#,df.name from v$datafile df,v$tablespace ts where ts.ts#=df.ts# and ts.name='TEST';

       TS#     FILE#  NAME
---------- ---------- --------------------------------------------------
         7       21   /u01/app/oracle/oradata/T1/pdb/test.dbf

RMAN下备份数据文件以用来恢复

RMAN> backup datafile 21;

1、模拟ALL ZERO

查看test数据

SQL> select count(*) from scott.test;

  COUNT(*)
----------
     10000

OS下使用dd命令

[oracle@T1 ~]$ dd if=/dev/zero of=/u01/app/oracle/oradata/T1/pdb/test.dbf bs=8192 count=1 seek=131 conv=notrunc
1+0 records in
1+0 records out
8192 bytes (8.2 kB) copied, 0.000155588 s, 52.7 MB/s

先刷新数据缓冲区，再次查看TEST表

SQL> alter system  flush buffer_cache;

System altered.

SQL> select count(*) from test;
select count(*) from test
       *
ERROR at line 1:
ORA-01578: ORACLE data block corrupted (file # 21, block # 131)
ORA-01110: data file 21: '/u01/app/oracle/oradata/T1/pdb/test.dbf'

发现坏块，查看视图发生坏块类型为ALL ZERO

SQL> select * from v$database_block_corruption;

     FILE#     BLOCK#     BLOCKS CORRUPTION_CHANGE# CORRUPTIO     CON_ID
---------- ---------- ---------- ------------------ --------- ----------
        21        131          1                  0  ALL ZERO          3

三、恢复方法

------恢复最先要考虑的一定要是备份恢复

1、RMAN

RMAN> restore datafile 21;
RMAN> recover datafile 21;

2、BBED

ALL ZERO类型的坏块无法用BBED，报错无效块类型，命令无法使用

BBED> set file 21
    FILE#              21

BBED> set block 131
    BLOCK#             131

BBED> map /v
 File: /u01/app/oracle/oradata/T1/pdb/test.dbf (21)
 Block: 131                                   Dba:0x05400083
------------------------------------------------------------
BBED-00400: invalid blocktype (00)

BBED> dump /v count 128
 File: /u01/app/oracle/oradata/T1/pdb/test.dbf (21)
 Block: 131     Offsets:    0 to  127  Dba:0x05400083
-------------------------------------------------------
 00000000 00000000 00000000 00000000 l ................
 00000000 00000000 00000000 00000000 l ................
 00000000 00000000 00000000 00000000 l ................
 00000000 00000000 00000000 00000000 l ................
 00000000 00000000 00000000 00000000 l ................
 00000000 00000000 00000000 00000000 l ................
 00000000 00000000 00000000 00000000 l ................
 00000000 00000000 00000000 00000000 l ................

 <16 bytes per line>

3、DBMS_REPAIR包

DBMS_REPAIR包（丢失坏块数据）可以标记和跳过坏块

1）创建管理表（DBMS_REPAIR包前三项值不变，最后一项填写所属表空间）

SQL> exec DBMS_REPAIR.ADMIN_TABLES('REPAIR_TABLE',1,1,'TEST');

PL/SQL procedure successfully completed.

SQL> exec DBMS_REPAIR.ADMIN_TABLES('ORPHAN_TABLE',2,1,'TEST');

PL/SQL procedure successfully completed.

2）检查坏块 DBMA_REPAIR.CHECK_OBJECT存储包（corrupt_count不变）

SQL> set serveroutput on;
SQL>   1  declare
  2  i number;
  3  begin
  4  DBMS_REPAIR.CHECK_OBJECT(schema_name => 'SYS',      ------坏块对象所属的用户名
  5                  object_name => 'TEST',              ------表名
  6                  corrupt_count => i);
  7  DBMS_OUTPUT.PUT_LINE(TO_CHAR(i));
  8 end;
  9 /
1                 ------正常情况下应该为0

PL/SQL procedure successfully completed.

如果有坏块，可以在创建的REPAIR_TABLE中查看块损坏的信息SQL：

SQL> set linesize 200
SQL> col OBJECT_NAME for a11
SQL> col CORRUPT_DESCRIPTION for a25
SQL> col REPAIR_DESCRIPTION for a30

SQL> SELECT object_name relative_file_id,block_id,marked_corrupt,corrupt_description,repair_description,CHECK_TIMESTAMP FROM repair_table;

OBJECT_NAME RELATIVE_FILE_ID   BLOCK_ID MARKED_COR CORRUPT_DESCRIPTION            REPAIR_DESCRIPTION             CHECK_TIME
----------- ---------------- ---------- ---------- ------------------------------ ------------------------------ ----------
TEST                      21        131 TRUE                                      mark block software corrupt    30-JUL-21

3）跳过坏块

之前虽然定位了坏块位置，但是如果访问TABAL还是会报错，这里需要用skip_corrupt_blocks来跳过坏块（flags不变）

SQL> exec DBMS_REPAIR.SKIP_CORRUPT_BLOCKS(schema_name => 'SYS',object_name => 'TEST',flags => 1);

PL/SQL procedure successfully completed.

SQL> select count(*) from test;

  COUNT(*)
----------
      9395

这里看出10000-9395=605，一共丢失了605行的数据。

4）处理index上的无效键值

DECLARE
   i    NUMBER;
BEGIN
   DBMS_REPAIR.dump_orphan_keys (schema_name         => 'SYS',            --SCHEMA用户
                                 object_name         => 'IDX_TEST_ID',        --索引名
                                 object_type         => 2,
                                 repair_table_name   => 'REPAIR_TABLE',
                                 orphan_table_name   => 'ORPHAN_TABLE',
                                 key_count           => i);
END;

5）查看之前生成的ORPHAN_TABLE可以直到丢失行的信息

SQL> select * from orphan_table;

6）重建freelist：rebuid_freelists

exec dbms_repair.rebuild_freelists(schema_name => 'SYS'   --所属用户SCHEMA
                        ,object_name => 'TEST'            --表名
                        );

3、CATS方式复制（EXP/IMP）

设置10231事件（这个事件让Oracle跳过只进行全表扫描的某些类型的损坏块，因此允许输出或“创建表作为选择“类型的操作，以便从没有损坏块的表中检索行，损坏块中的数据丢失。）

SQL> ALTER SYSTEM SET EVENTS '10231 trace name context forever,level 10';

System altered.

创建一个临时表，把TEST中除坏块以外的数据都导出来（如果表大，可以把表单独导出）

SQL> create table recover_data_temp as select * from test;

Table created.

导出表

[oracle@T1 pdb]$ exp "'sys/oracle@pdb as sysdba'" file=test.dmp tables=test;

导入表

SQL> drop table test;

Table dropped.

[oracle@T1 pdb]$ imp "'sys/oracle@pdb as sysdba'" file=test.dmp tables=test;

验证

SQL> select count(*) from test;

  COUNT(*)
----------
      9395

同样也是丢失了605行的数据

取消10231 events

SQL> alter system set events='10231 trace name context off';

System altered.

posted @ 2021-07-30 15:18 蟹Bro 阅读(1075) 评论(0) 编辑收藏举报

刷新页面返回顶部

蟹Bro

前人栽树，后人乘凉

【Oracle坏块】Oracle坏块介绍 & 坏块类型：ALL ZERO

公告