《高性能SQL调优精要与案例解析》一书谈SQL调优(SQL TUNING或SQL优化)学习
《高性能SQL调优精要与案例解析》一书上市发售以来,很多热心读者就该书内容及一些具体问题提出了疑问,因读者众多外加本人日常工作的繁忙 ,在这里就SQL调优学习进行讨论并对热点问题统一作答。
首先,我们说说何为SQL调优。SQL调优是关系库领域的一项技能或工作,其来自SQL Tuning一词,虽然也有很多同行更多称之为SQL优化,对应的英文单词为SQL Optimization,但本人始终认为SQL调优是一个过程,SQL调优也更能体现这项技术或工作的过程,而SQL优化一词,本人认为更通俗些,也更能体现这项技术或工作的结果,个人认为SQL调优精确和专业些,因此,也更习惯将这项技能或工作称为SQL调优。
其次,有些读者会问道《高性能SQL调优精要与案例解析》一书中,前面五章是否和SQL调优相关,是否可有可无?本人认为这是本书的一大特色,那就是更注重基础理论的讲解和学习,任何一门技能的学习,基础 和理论很重要,这也是本书的亮点和特性之一。不可否认,很多同类书中的案例非常好,也很有代表性,而恰恰是这些基础理论的缺失,容易让很大一部分读者阅读这些书籍时感到非常的迷茫。SQL调优的关键是根据SQL语句,执行计划和具体数据环境的对比,找出SQL语句解析和执行过程中出现问题的环节,进而才能通过最合理的措施去解决这个出问题的环节。SQL语句,这个一般不会存在问题,想学SQL调优的读者,没几个不懂SQL语句的,具体数据环境,也不会存在问题,关键的问题是阅读和分析执行计划,而做到这点的前提是能读懂执行计划中的相关操作和数据项,然而,理解这些操作和数据项,是需要基础理论的支撑的,也就是说,需要掌握数据库相关的基础理论的,比如:要理解全表扫描(FTS)操作,就得知道表的概念,段的概念,段的HWM的概念;要理解索引(INDEX)相关的操作,就得知道索引的概念,索引的组织结构,索引的特性;要理解分组和排序(GROUP BY和ORDER BY),我们就得知道私有内存区(PGA)是怎么回事儿,其是如何组织和管理的;要理解逻辑读,我们就得理解缓冲区(Buffer),进而需要理解数据块等概念。。。所以,要想真正掌握SQL调优,掌握这些基础理论是必要的,否则,只看那些具体的案例,也没多大意义,因为脱离了具体的理论,看那些案例根本就理解不了案例中那么做的根本原因,只掌握些方法,而不能理解,遇到问题只能生搬硬套,多数时候根本解决不了问题,还可能越弄越糟。当然,我不是说那些案例没有用,在掌握了基础理论后,去研究和分析一些案例,也是很有价值的。就像一位神医给了我们一个绝世秘方,我们能看懂吗?看不懂,因为我们不懂医学知识,有用吗?估计没多大用,我们横不能见到病人就用那个药方,SQL调优解决问题,道理和医生给人看病是一样的,只是我们面对的是数据库,医生面对的是人而已。通过上面这些,我们知道,《高性能SQL调优精要与案例解析》一书中前四章基础理论不但很重要,而且必须有。。第五章讲的是事务相关内容,这章内容说实话,和SQL调优没太大直接关系,但我为什么写呢?因为关系库中的锁资源,是非常珍贵的资源,因为锁机制实现方面因素,其他有些关系库中锁资源更加珍贵,而Oracle中锁机制虽然更优越些,从而Oracle应用人员在涉及DML操作时可以更从容些,但这并不意味着可以为所欲为,现实中,即使很多资深研发人员,都不是很懂得Oracle事务的特性和应用,以至于经常不必要的用到手工加锁的语句,这既造成了大量锁相关资源的浪费,更主要的会造成严重的锁阻塞和死锁等问题,进而导致严重的后果,这也是本人在本书中增加事务一章内容的初衷。
再次,有些读者会问到《高性能SQL调优精要与案例解析》一书主要以Oracle数据库为例讲解了SQL调优,而该书是否适用其他关系库?本人写该书的初衷,是为想学习SQL调优及从事该项工作的读者提供一个学习和掌握SQL调优的正确而快捷的路径和方法,而SQL调优这项技能,必须在深入理解和掌握关系库机制和原理的前提下才能做好,而大家知道,各关系库大的方面有很多共性,只是有些具体的细节会有所不同,就拿索引来说吧,各关系的实现细节是稍有差别的,然而,我们并不能期望各关系库所有细节都完全一样,毕竟,即使同一种关系库,不同版本的具体细节也是有差别的,并且,有些差别还比较大,我们能做的只能是不断学习和提升自己。因此,要想讲解SQL调优这门技能,尤其是通过具体实例去讲解,必须选择某型关系库进行具体讲解,没有谁能脱离具体的数据库选型,能把SQL调优这门技能讲清楚,因为脱离具体的数据库,根本什么也讲不了,也讲不清楚。本人之所以选择Oracle来进行讲解,其一是关系库市场上Oracle的占有率比较高,本人接触的也比较多;其二,所有关系库中,就优化器来讲,Oracle的优化器也是最先进的。就SQL调优分析和解决问题的思路、方法和步骤来说,各关系库几乎是相同的,只是具体形式、命令、方法会有所差别,例如:Oracle获取执行计划,可以通过GUI工具,可以通过命令行,也可以通过系统内置的包,还可以通过跟踪来获取;而SQL SERVER,也可以通过EM工具,通过命令行,也可以通过跟踪获取;而DB2和开源关系库,也可以通过多种方法获取SQL语句的执行计划。而阅读和分析执行计划来说,各关系库几乎是相同的。Oracle提供了大量的系统视图来获取有些信息,高版本的SQL SERVER和DB2,甚至高版本的开源关系库也提供了大量的系统视图。Oracle对SQL语句的优化依赖统计数据,SQL SERVER和DB2也同样依赖统计数据,甚至开源关系库也依赖统计数据,只是他们生成和实现的机制和细节会有些差异。又比如说,Oracle提供了大量的hint,SQL server和db2也提供了hint这种调优方式,只是具体hint的作用和语法不同,开源库有些版本也提供了hint功能,也许实现的没那么完美而已。还有,本书虽然以Oracle为基础讲解,但在写作过程中,也尽量注意剥离和泛化Oracle相关的一些具体特性和命令,并对与其他关系库相通之处进行了说明和提示,以期尽量让其他关系库的读者通过阅读本书也能从中受益,从而达到触类傍通的效果。
最后,非常感谢各位读者的关注,如有任何疑问,可以通过本人邮箱、微博或本博客通知本人,如不能一一回复,也一定尽力抽时间统一答复,见谅,再次感谢。
----------------------------------------------------------
《高性能SQL调优精要与案例解析》
blog1:http://www.cnblogs.com/lhdz_bj
blog2:http://blog.itpub.net/8484829
blog3:http://blog.csdn.net/tuning_optmization