【Oracle】详解ADDM工具
一、ADDM简介
在Oracle9i及之前,DBA们已经拥有了很多很好用的性能分析工具,比如,tkprof、sql_trace、statspack、set
event 10046&10053等等。这些工具能够帮助DBA很快的定位性能问题。但这些工具都只给出一些统计数据,然后再由DBA们根据自己的经验进行优化。
那能不能由机器自动在统计数据的基础上给出优化建议呢?Oracle10g中就推出了新的优化诊断工具:数据库自动诊断监视工具(Automatic Database Diagnostic Monitor ADDM)和SQL优化建议工具(SQL Tuning Advisor STA)。这两个工具的结合使用,能使DBA节省大量优化时间,也大大减少了系统宕机的危险。简单点说,ADDM就是收集相关的统计数据到自动工作量知识库(Automatic Workload Repository AWR)中,而STA则根据这些数据,给出优化建议。例如,一个系统资源紧张,出现了明显的性能问题,由以往的办法,做个一个statspack快照,等30分钟,再做一次。查看报告,发现’db file scattered read’事件在top 5 events里面。根据经验,这个事件一般可能是因为缺少索引、统计分析信息不够新、热表都放在一个数据文件上导致IO争用等原因引起的。根据这些经验,我们需要逐个来定位排除,比如查看语句的查询计划、查看user_tables的last_analysed子段,检查热块等等步骤来最后定位出原因,并给出优化建议。但是,有了STA以后,它就可以根据ADDM采集到的数据直接给出优化建议,甚至给出优化后的语句。
ADDM能发现定位的问题包括:
·操作系统内存页入页出问题
·由于Oracle负载和非Oracle负载导致的CPU瓶颈问题
·导致不同资源负载的Top SQL语句和对象——CPU消耗、IO带宽占用、潜在IO问题、RAC内部通讯繁忙
·按照PLSQL和JAVA执行时间排的Top SQL语句.
·过多地连接(login/logoff).
·过多硬解析问题——由于shared pool过小、书写问题、绑定大小不适应、解析失败原因引起的
·过多软解析问题
·索引查询过多导致资源争用.
·由于用户锁导致的过多的等待时间(通过包dbms_lock加的锁)
·由于DML锁导致的过多等待时间(例如锁住表了)
·由于管道输出导致的过多等待时间(如通过包dbms_pipe.put进行管道输出)
·由于并发更新同一个记录导致的过多等待时间(行级锁等待)
·由于ITL不够导致的过多等待时间(大量的事务操作同一个数据块)
·系统中过多的commit和rollback(logfile sync事件).
·由于磁盘带宽太小和其他潜在问题(如由于logfile太小导致过多的checkpoint,MTTR设置问题,过多的undo操作等等)导致的IO性能问题
·对于DBWR进程写数据块,磁盘IO吞吐量不足
·由于归档进程无法跟上redo日至产生的速度,导致系统变慢
·redo数据文件太小导致的问题
·由于扩展磁盘分配导致的争用
·由于移动一个对象的高水位导致的争用问题
·内存太小问题——SGA Target, PGA, Buffer Cache,Shared Pool
·在一个实例或者一个机群环境中存在频繁读写争用的热块
·在一个实例或者一个机群环境中存在频繁读写争用的热对象
·RAC环境中内部通讯问题
·LMS进程无法跟上导致锁请求阻塞
·在RAC环境中由于阻塞和争用导致的实例倾斜
·RMAN导致的IO和CPU问题
·Streams和AQ问题
·资源管理等待事件
注意:AWR收集的数据时放到内存中(share pool),通过一个新的后台进程MMON定期写到磁盘中。所以10g的share pool要求比以前版本更大,一般推荐比以前大15-20%。另外,还要求系统参数STATISTICS_LEVEL设置为TYPICAL(推荐)或ALL;
ALTER SESSION SET STATISTICS_LEVEL= TYPICAL;
二、案例
1.---SCOTT用户下创建测试表t1:
16:57:34 SCOTT@GOOD> create table t1 (id number);
Table created.
2.---SYS用户下收集AWR Snapshot:
16:56:33 SYS@GOOD> begin
17:02:15 2 dbms_workload_repository.create_snapshot('TYPICAL');
17:02:15 3 end;
17:02:15 4 /
PL/SQL procedure successfully completed.
3.---SCOTT用户下向表t1中插入大量数据:
17:03:37 SCOTT@GOOD> begin
17:03:38 2 for i in 1..1000000 loop
17:03:38 3 execute immediate 'insert into scott.t1 values('||i||')';
17:03:38 4 end loop;
17:03:38 5 end;
17:03:38 6 /
PL/SQL procedure successfully completed.
4.---TOM用户下向表t1中插入大量数据:
17:03:37 SCOTT@GOOD> begin
17:03:38 2 for i in 1..1000000 loop
17:03:38 3 execute immediate 'insert into scott.t1 values('||i||')';
17:03:38 4 end loop;
17:03:38 5 end;
17:03:38 6 /
PL/SQL procedure successfully completed.
5.---在SYS用户下再次收集AWR Snapshot:
17:02:18 SYS@GOOD> begin
17:28:18 2 dbms_workload_repository.create_snapshot('TYPICAL');
17:28:18 3 end;
17:28:18 4 /
PL/SQL procedure successfully completed.
6.---查询生成的快照:
17:31:59 SYS@GOOD> select snap_id,BEGIN_INTERVAL_TIME,END_INTERVAL_TIME from dba_hist_snapshot order by snap_id asc;
SNAP_ID BEGIN_INTERVAL_TIME END_INTERVAL_TIME
---------- -------------------------- ---------------------------
1 10-NOV-16 02.59.56.000 PM 19-DEC-16 09.50.08.076 AM
2 19-DEC-16 10.59.49.000 PM 19-DEC-16 11.10.08.042 PM
...
54 25-DEC-16 04.00.54.990 PM 25-DEC-16 04.56.32.441 PM
55 25-DEC-16 04.56.32.441 PM 25-DEC-16 05.02.16.537 PM
56 25-DEC-16 05.02.16.537 PM 25-DEC-16 05.28.19.428 PM
56 rows selected.
7.---创建优化任务并执行:
17:36:40 SYS@GOOD> DECLARE
17:36:41 2 task_name VARCHAR2(30) := 'DEMO_ADDM01';
17:36:41 3 task_desc VARCHAR2(30) := 'ADDM Feature Test';
17:36:41 4 task_id NUMBER;
17:36:41 5 BEGIN
17:36:41 6 dbms_advisor.create_task('ADDM',task_id,task_name,task_desc,null);
17:36:41 7 dbms_advisor.set_task_parameter(task_name,'START_SNAPSHOT',55);
17:36:41 8 dbms_advisor.set_task_parameter(task_name,'END_SNAPSHOT',56);
17:36:41 9 dbms_advisor.set_task_parameter(task_name,'INSTANCE',1);
17:36:41 10 dbms_advisor.set_task_parameter(task_name,'DB_ID',244129167);
17:36:41 11 dbms_advisor.execute_task(task_name);
17:36:41 12 END;
17:36:41 13 /
PL/SQL procedure successfully completed.
其中,set_task_parameter是用来设置任务参数的。START_SNAPSHOT是起始快照ID,END_SNAPSHOT是结束快照ID,INSTANCE是实例号,对于单实例,一般是1,在RAC环境下,可以通过查询视图v$instance得到,DB_ID是数据库的唯一识别号,可以通过查询v$database查到。
8.---查看优化建议结果:
17:38:44 SYS@GOOD> SELECT dbms_advisor.get_task_report('DEMO_ADDM01','TEXT','ALL') FROM DUAL;
DBMS_ADVISOR.GET_TASK_REPORT('DEMO_ADDM01','TEXT','ALL')
--------------------------------------------------------------------------------
ADDM Report for Task 'DEMO_ADDM01'
----------------------------------
Analysis Period
---------------
AWR snapshot range from 55 to 56.
Time period starts at 25-DEC-16 05.02.17 PM
Time period ends at 25-DEC-16 05.28.19 PM
....中间部分省略
The database's maintenance windows were active during 99% of the analysis
period.
9.诊断分析结果
我们从上面的建议结果看到了,ADDM Report的结果与Statspack Report的结果大不相同。Statspack Report的结果给出的都是统计数据、各种事件,然后由DBA根据这些数据给出优化建议,而ADDM Report的结果包含就已经是给出的优化建议了。