Oracle SQL高级编程

查看书籍详细信息:

Oracle SQL高级编程

编辑推荐

  资深Oracle专家力作,OakTable团队推荐
  全面、独到、翔实,题材丰富
  Oracle开发人员和DBA必备

内容简介

  Oracle 数据库中的SQL是当今市场上功能最强大的SQL实现之一,而本书全面展示了这一工具的威力。如何才能让更多人有效地学习和掌握SQL呢?Karen Morton及其团队在本书中提供了专业的方案:先掌握语言特性,再学习Oracle为提升语言效率而加入的支持特性,进而将两者综合考虑并在工作中加以应用。作者通过总结各自多年的软件开发和教学培训经验,与大家分享了掌握Oracle SQL所独有的丰富功能的技巧所在,内容涵盖SQL执行、联结、集合、分析函数、子句、事务处理等多个方面。读者可以学习到以下几个方面的技巧:
  掌握Oracle数据库中独有的SQL强大特征;
  读取并理解SQL执行计划;
  快速分析并改进表现欠佳的SQL;
  通过提示及配置文件等来控制执行计划;
  在程序中优化查询而无需改动代码。
    作为Oracle SQL经典著作之一,本书为SQL开发人员指明了前行的方向,赋予了他们不断开拓的动力。

作者简介

  KAREN MORTON 研究人员、教育家及顾问,Fidelity信息服务公司的资深数据库管理员和性能调优专家。她从20世纪90年代初就开始使用Oracle,从事 Oracle的教学工作也已经超过10年的时间。她是Oracle ACE,也是OakTable(Oracle社区中著名的“Oracle科学家”的非正式组织)的成员,经常在技术会议上演讲。她的著作还包括 Expert Oracle Practices和Beginning Oracle SQL,博客主页是karenmorton.blogspot.com。


  KERRY OSBORNE  专注于Oracle咨询的Enkitec公司的创始人之一。从1982年开始使用Oracle(第2版)。他当过开发人员,也做过DBA,目前是 Oracle ACE总监和OakTable成员。最近几年,他专注于研究Oracle内部原理以及解决性能问题。他的博客主页是 kerryosborne.oracle-guy.com。
  ROBYN SANDS 思科公司的软件工程师,为思科的客户设计开发嵌入式Oracle数据库产品。从1996年开始使用Oracle,在应用开发、大型系统实现以及性能评估方面具有丰富的经验。她是OakTable的成员,同时是Expert Oracle Practices (2010年 Apress出版)一书的合著者。

  RIYAJ SHAMSUDEEN 专注于性能/数据恢复/电子商务的咨询公司OraInternals的首席数据库管理员和董事长。有近20年使用Oracle技术产品以及Oracle数据库管理员/Oracle数据库应用管理员的经验,是真正应用集群、性能调优以及数据库内部属性方面的专家。同时是一位演讲家及Oracle ACE。

  JARED STILL 从1994年就开始使用Oracle。他认为对于SQL的学习是永无止境的,相信每一个查询Oracle数据库的人都需要精通SQL语言,才能写出高效的查询。他参与本书的编写就是为了帮助别人实现这一目标。

目录

第1 章  SQL 核心  
1.1  SQL 语言  
1.2  数据库的接口  
1.3  SQL*Plus 回顾  
1.3.1  连接到数据库  
1.3.2  配置SQL*Plus 环境  
1.3.3  执行命令  
1.4 5  个核心的SQL 语句  
1.5  SELECT 语句  
1.5.1  FROM 子句  
1.5.2  WHERE 子句  
1.5.3  GROUP BY 子句  
1.5.4  HAVING 子句  
1.5.5  SELECT 列表  
1.5.6  ORDER BY 子句  
1.6  INSERT 语句  
1.6.1  单表插入  
1.6.2  多表插入  
1.7  UPDATE 语句  
1.8  DELETE 语句  
1.9  MERGE 语句  
1.10  小结  
第2 章  SQL 执行  
2.1  Oracle 架构基础  
2.2  SGA-共享池  
2.3  库高速缓存  
2.4  完全相同的语句  
2.5  SGA-缓冲区缓存  
2.6  查询转换  
2.7  视图合并  
2.8  子查询解嵌套  
2.9  谓语前推  
2.10  使用物化视图进行查询重写  
2.11  确定执行计划  
2.12  执行计划并取得数据行  
2.13  SQL 执行——总览  
2.14  小结  
第3 章  访问和联结方法  
3.1  全扫描访问方法  
3.1.1  如何选择全扫描操作  
3.1.2  全扫描与舍弃  
3.1.3  全扫描与多块读取  
3.1.4  全扫描与高水位线  
3.2  索引扫描访问方法  
3.2.1  索引结构  
3.2.2  索引扫描类型  
3.2.3  索引唯一扫描  
3.2.4  索引范围扫描  
3.2.5  索引全扫描  
3.2.6  索引跳跃扫描  
3.2.7  索引快速全扫描  
3.3  联结方法  
3.3.1  嵌套循环联结  
3.3.2  排序—合并联结  
3.3.3  散列联结  
3.3.4  笛卡儿联结  
3.3.5  外联结  
3.4  小结  
第4 章  SQL 是关于集合的  
4.1  以面向集合的思维方式来思考  
4.1.1  从面向过程转变为基于集合的思维方式  
4.1.2  面向过程vs.基于集合的思维方式:一个例子  
4.2  集合运算  
4.2.1  UNION 和UNION ALL  
4.2.2  MINUS  
4.2.3  INTERSECT   
4.3  集合与空值  
4.3.1  空值与非直观结果  
4.3.2  集合运算中的空值行为  
4.3.3  空值与GROUP BY 和ORDER BY   
4.3.4  空值与聚合函数  
4.4  小结  
第5 章  关于问题  
5.1  问出好的问题  
5.2  提问的目的  
5.3  问题的种类  
5.4  关于问题的问题  
5.5  关于数据的问题  
5.6  建立逻辑表达式  
5.7  小结  
第6 章  SQL 执行计划  
6.1  解释计划  
6.1.1  使用解释计划  
6.1.2  理解解释计划可能达不到目的的方式  
6.1.3  阅读计划  
6.2  执行计划  
6.2.1  查看最近生成的SQL 语句  
6.2.2  查看相关执行计划  
6.2.3  收集执行计划统计信息  
6.2.4  标识SQL 语句以便以后取回计划  
6.2.5  深入理解DBMS_XPLAN 的细节  
6.2.6  使用计划信息来解决问题  
6.3  小结  
第7 章  高级分组  
7.1  基本的GROUP BY 用法  
7.2  HAVING 子句  
7.3  GROUP BY 的“新”功能  
7.4  GROUP BY 的CUBE 扩展  
7.5  CUBE 的实际应用  
7.6  通过GROUPING()函数排除空值  
7.7  用GROUPING()来扩展报告  
7.8  使用GROUPING_ID()来扩展报告  
7.9  GROUPING SETS 与ROLLUP()   
7.10  GROUP BY 局限性  
7.11  小结  
第8 章  分析函数  
8.1  示例数据  
8.2  分析函数剖析  
8.3  函数列表  
8.4  聚合函数  
8.4.1  跨越整个分区的聚合函数  
8.4.2  细粒度窗口声明  
8.4.3  默认窗口声明  
8.5  Lead 和Lag   
8.5.1  语法和排序  
8.5.2  例1:从前一行中返回一个值  
8.5.3  理解数据行的位移  
8.5.4  例2:从下一行中返回一个值  
8.6  First_value 和Last_value   
8.6.1  例子:使用First_value 来计算最大值  
8.6.2  例子:使用Last_value 来计算最小值  
8.7  其他分析函数  
8.7.1  Nth_value (11gR2)   
8.7.2  Rank   
8.7.3  Dense_rank   
8.7.4  Row_number   
8.7.5  Ratio_to_report   
8.7.6  Percent_rank   
8.7.7  Percentile_cont   
8.7.8  Percentile_disc   
8.7.9  NTILE  
8.7.10  Stddev   
8.7.11  Listagg   
8.8  性能调优  
8.8.1  执行计划  
8.8.2  谓语  
8.8.3  索引  
8.9  高级话题  
8.9.1  动态SQL   
8.9.2  嵌套分析函数  
8.9.3  并行  
8.9.4  PGA 大小  
8.10  组织行为  
8.11  小结  
第9 章  Model 子句  
9.1  电子表格  
9.2  通过Model 子句进行跨行引用  
9.2.1  示例数据  
9.2.2  剖析Model 子句  
9.2.3  规则  
9.3  位置和符号引用  
9.3.1  位置标记  
9.3.2  符号标记  
9.3.3  FOR 循环  
9.4  返回更新后的行  
9.5  求解顺序  
9.5.1  行求解顺序  
9.5.2  规则求解顺序  
9.6  聚合  
9.7  迭代  
9.7.1  一个例子  
9.7.2  PRESENTV与空值  
9.8  查找表  
9.9  空值  
9.10  使用Model子句进行性能调优  
9.10.1  执行计划  
9.10.2  谓语前推  
9.10.3  物化视图  
9.10.4  并行  
9.10.5  Model 子句执行中的分区  
9.10.6  索引  
9.11  子查询因子化  
9.12  小结  
第10 章  子查询因子化  
10.1  标准用法  
10.2  SQL 优化  
10.2.1  测试执行计划  
10.2.2  跨多个执行的测试  
10.2.3  测试查询改变的影响  
10.2.4  寻找其他优化机会  
10.2.5  将子查询因子化应用到PL/SQL 中  
10.3  递归子查询  
10.3.1  一个CONNECT BY 的例子  
10.3.2  使用RSF 的例子  
10.3.3  RSF 的限制条件  
10.3.4  与CONNECT BY 的不同点  
10.4  复制CONNECT BY 的功能  
10.4.1  LEVEL 伪列  
10.4.2  SYS_CONNECT_BY_PATH 函数  
10.4.3  CONNECT_BY_ROOT 运算符  
10.4.4  CONNECT_BY_ISCYCLE伪列和NOCYCLE 参数  
10.4.5  CONNECT_BY_ISLEAF 伪列  
10.5  小结  
第11 章  半联结和反联结  
11.1  半联结  
11.2  半联结执行计划  
11.3  控制半联结执行计划  
11.3.1  使用提示控制半联结执行计划  
11.3.2  在实例级控制半联结执行计划  
11.4  半联结限制条件  
11.5  半联结必要条件  
11.6  反联结  
11.7  反联结执行计划  
11.8  控制反联结执行计划  
11.8.1  使用提示控制反联结执行计划  
11.8.2  在实例级控制反联结执行计划  
11.9  反联结限制条件  
11.10  反联结必要条件  
11.11  小结  
第12 章  索引  
12.1  理解索引  
12.1.1  什么时候使用索引  
12.1.2  列的选择  
12.1.3  空值问题  
12.2  索引结构类型  
12.2.1  B-树索引  
12.2.2  位图索引  
12.2.3  索引组织表  
12.3  分区索引  
12.3.1  局部索引  
12.3.2  全局索引  
12.3.3  散列分区与范围分区  
12.4  与应用特点相匹配的解决方案  
12.4.1  压缩索引  
12.4.2  基于函数的索引  
12.4.3  反转键索引  
12.4.4  降序索引  
12.5  管理问题的解决方案  
12.5.1  不可见索引  
12.5.2  虚拟索引  
12.5.3  位图联结索引  
12.6  小结  
第13 章  SELECT 以外的内容  
13.1  INSERT  
13.1.1  直接路径插入  
13.1.2  多表插入  
13.1.3  条件插入  
13.1.4  DML 错误日志  
13.2  UPDATE  
13.3  DELETE  
13.4  MERGE   
13.4.1  语法和用法  
13.4.2  性能比较  
13.5  小结  
第14 章  事务处理  
14.1  什么是事务  
14.2  事务的ACID 属性  
14.3  事务隔离级别  
14.4  多版本读一致性  
14.5  事务控制语句  
14.5.1  Commit(提交)  
14.5.2  Savepoint(保存点)   
14.5.3  Rollback(回滚)   
14.5.4  Set Transaction(设置事务)   
14.5.5  Set Constraints(设置约束)   
14.6  将运算分组为事务  
14.7  订单录入模式  
14.8  活动事务  
14.9  使用保存点  
14.10  序列化事务  
14.11  隔离事务  
14.12  自治事务  
14.13  小结  
第15 章  测试与质量保证  
15.1  测试用例  
15.2  测试方法  
15.3  单元测试  
15.4  回归测试  
15.5  模式修改  
15.6  重复单元测试  
15.7  执行计划比较  
15.8  性能测量  
15.9  在代码中加入性能测量  
15.10  性能测试  
15.11  破坏性测试  
15.12  通过性能测量进行系统检修  
15.13  小结  
第16 章  计划稳定性与控制  
16.1  计划不稳定性:理解这个问题  
16.1.1  统计信息的变化  
16.1.2  运行环境的改变  
16.1.3  SQL 语句的改变  
16.1.4  绑定变量窥视  
16.2  识别执行计划的不稳定性  
16.2.1  抓取当前所运行查询的数据  
16.2.2  查看一条语句的性能历史  
16.2.3  按照执行计划聚合统计信息  
16.2.4  寻找执行计划的统计方差  
16.2.5  在一个时间点附近检查偏差  
16.3  执行计划控制:解决问题  
16.3.1  调整查询结构  
16.3.2  适当使用常量  
16.3.3  给优化器一些提示  
16.4  执行计划控制:不能直接访问代码  
16.4.1  选项1:改变统计信息  
16.4.2  选项2:改变数据库参数  
16.4.3  选项3:增加或移除访问路径  
16.4.4  选项4:应用基于提示的执行计划控制机制  
16.4.5  大纲  
16.4.6  SQL 概要文件  
16.4.7  SQL 执行计划基线  
16.4.8  基于提示的执行计划控制机制总结  
16.5  结论 

媒体评论

  本书作者全部是OakTable的成员,且具有15~29年丰富的Oracle开发经验。在研究一些被其他专门讨论Oracle SQL语言的参考书直接忽略的问题时,这种对Oracle数据库的长期钻研无疑是一个巨大的优势。
  ——亚马逊读者评论

 

在线试读部分章节

SQL核心
  凯伦?莫顿(Karen Morton)
  
  不管你是刚开始写SQL语句还是已经写过很多年了,学会写出“好的”SQL这个过程都需要具有很扎实的SQL核心语法和概念基础知识。本章对SQL语言的核心概念及其性能做了回顾,同时还描述了一些你应该已经很熟悉的常用SQL命令。对于那些以前曾经使用过SQL并且基础知识相当牢靠的读者来说,本章就是一个简要的复习,让你为后面更详细的SQL论述做好准备。如果你是一位SQL新人,你可能想要先阅读Beginning Oracle SQL这本书以确保掌握SQL的基础。不管是哪种情况,第1章的目的就是通过对5个核心SQL语句的快速浏览来衡量一下你的SQL水平,同时还概述了我们用来执行SQL语句的工具:SQL*Plus。
  1.1 SQL语言
  SQL语言最早是IBM公司于20世纪70年代开发出来的,称为结构化英文查询语言,简称为SEQUEL。该语言是基于E.F.Codd在1969年提出的关系型数据库管理系统(RDBMS)的。后来因为商标的纠纷,其简称又进一步缩写为SQL。1986年和1987年,ANSI(美国国家标准化组织)和ISO(国际标准化组织)先后将SQL语言采纳为标准语言。而人们并不熟悉的是,ANSI官方曾将SQL语言的读音确定为“S-Q-L”。绝大多数人,包括我本人,都还在使用“sequel”的读音,只是因为这样读起来更顺口一些。
  SQL的目的就是简单地提供一个到数据库的接口,在本书指的是Oracle数据库。每一条SQL语句对于数据库来说就是一条命令或指令。SQL与其他编程语言(如C或Java)的区别就在于它是要处理数据集合而不是一行一行的数据。语言本身也不需要你提供如何导航到数据的指令——这是在后台透明地进行的。但你将在后面的章节中看到,如果想在Oracle中写出高效的SQL语句,了解数据及其在数据库中的存储方式与存储位置是很重要的。
  由于不同的供应商(例如甲骨文、IBM和微软)实现SQL核心功能的机制相差无几,所以基于某一种数据库所学的技巧同样可以应用到其他类型的数据库上。你基本上可以利用同样的SQL语句来进行数据的查询、插入、更新和删除,以及创建、修改和删除对象,而不必管数据库的供应商是哪家。
  尽管SQL是各种关系型数据库管理系统的标准语言,但实际上它并不一定是关系型的。在本书后面我将就这一点稍作扩展。如果想要了解更多的细节,我推荐大家阅读C.J.Date的SQL and Relational Theory一书。需要铭记于心的一点是SQL语言并不总是严格遵守关系模型的——它根本就没有实现关系模型的某些要素,同时还不恰当地实现了一些要素。事实上,既然SQL是基于关系模型的,那么要想写出尽可能正确高效的SQL语句,你不仅必须要理解SQL语言,还要理解关系模型。
  1.2 数据库的接口
  多年以来人们开发出多种途径来传递SQL语句到数据库并获得结果。Oracle数据库的本地接口界面是Oracle调用界面(OCI)。OCI将由Oracle内核传送而来的查询语句发送到数据库。当使用某种Oracle工具如SQL*Plus或者SQL Developer时,你都在使用OCI。其他的Oracle工具如SQL*Loader、数据泵(Data Pump)以及Real Application Testing (RAT)既使用OCI,也可以使用语言特定的接口,如Oracle JDBC-OCI、ODP.Net、Oracle预编译器、Oracle ODBC以及Oracle C++调用接口(OCCI)驱动器。
  当使用编程语言(如COBOL或C语言)时,你所写的语句被称为嵌入式的SQL语句并且在应用程序编译之前会由SQL预处理器进行预处理。代码清单1-1是一段可以在C/C++程序块中使用的SQL语句的例子。
  代码清单1-1 C/C++程序块中所嵌入的SQL语句
  
  其他工具,例如SQL*Plus和SQL Developer,都是交互式的工具。你输入并执行命令,然后获得相应的输出。交互式工具并不需要在运行代码前先精确编译,你只需要输入想要执行的命令即可。代码清单1-2是一段使用SQL*Plus执行语句的例子。
  代码清单1-2 使用SQL*Plus执行SQL语句
  
  在本书中,为了保持一致性我们所用的示例代码清单都使用SQL*Plus工具,但需要记住的是,不管你是用什么方法或工具来输入和执行SQL语句,所有的事情最后都要通过OCI来传递到数据库。这里的主旨就是不管你所使用的是什么工具,其本地接口都是一样的。
  1.3 SQL*Plus回顾
  SQL*Plus是一个不管采用哪个安装平台(Windows或Unix)都会提供的命令行工具。它是一个用来输入和执行SQL语句并显示输出结果的纯文本环境。用该工具可以直接输入、编辑命令,可以一条条地保存和执行命令或者通过脚本文件来进行,然后将输出结果以很精美格式的报表输出。要启动SQL*Plus你只需要在主机的命令提示符后敲入sqlplus即可。
  1.3.1 连接到数据库
  有多种方法可以通过SQL*Plus连接数据库。然而在连接之前,你还需要在$ORACLE_HOME/ network/admin/tnsnames.ora这个文件中登记想要连接的数据库。有两种通常使用的方法,或者如代码清单1-3所示那样在启动SQL*Plus时提供连接信息,或者如代码清单1-4所示那样在启动SQL*Plus以后使用connect命令。
  代码清单1-3 通过窗口命令提示符连接到SQL*Plus
  
  如果想要启动SQL*Plus而又不显示登录到数据库后的提示,可以在启动SQL*Plus时使用/nolog选项。
  代码清单1-4 通过SQL>提示符连接SQL*Plus并登录到数据库
  
  1.3.2 配置SQL*Plus环境
  SQL*Plus有很多的命令可以让你来定制工作环境和显示选项。代码清单1-5所示是在SQL>提示符下输入help index命令后显示出来的可用的命令。
  代码清单1-5 SQL*Plus命令列表
  
  set命令是用来定制工作环境的最基本的命令。代码清单1-6为set命令的帮助文本。
  代码清单1-6 SQL*Plus的SET命令
  
  
  
  有了上面这些可用命令,你就能够很轻松地定制最适合你的运行环境了。但有一点要铭记于心的就是当你退出或关闭SQL*Plus的时候,这些设置命令就不再被保留了。为了避免每次使用SQL*Plus时都重新敲入一遍这些设置命令,你可以创建一个login.sql文件。事实上每次启动SQL*Plus的时候它都会默认去读两个文件。第一个是$ORACLE_HOME/sqlplus/admin目录下的glogin.sql文件。如果找到了这个文件,它就会被读进来,文件中的命令语句也会被执行。这样就可以把那些定制你的会话体验的SQL*Plus命令和SQL语句保存起来。
  在读取glogin.sql文件以后,SQL*Plus会进一步寻找login.sql文件。这个文件必须在SQL*Plus的启动文件夹中或者包含在环境变量SQLPATH所指向的文件夹路径中。在login.sql文件中的所有命令优先级都比glogin.sql文件中的命令高。从10g开始,Oracle在每次你启动SQL*Plus或者从SQL*Plus里执行connect命令的时候都会同时去读取glogin.sql和login.sql这两个文件。在Oracle 10g之前,login.sql脚本文件只有在SQL*Plus启动的时候才会被执行。代码清单1-7是一个常见的login.sql文件内容。
  代码清单1-7 一个常见的login.sql文件
  
  注意这里在SET SQLPROMPT中使用的变量_user和_connect_identifier。它们是预定义变量的两个示例。你可以在login.sql文件中或者任何你创建的脚本文件中使用下面这些预定义变量:
  ·_connect_identifier
  ·_date
  ·_editor(这个变量指定了当你使用edit命令的时候启动哪个编辑器)
  ·_o_version
  ·_o_release
  ·_privilege
  ·_sqlplus_release
  ·_user
  1.3.3 执行命令
  有两种命令可以在SQL*Plus中执行:SQL语句和SQL*Plus命令。代码清单1-5和代码清单1-6中所列出的SQL*Plus命令对于SQL*Plus来说是特有的命令,可以用来定制运行环境并且可以运行SQL*Plus特有的命令,例如DESCRIBE和CONNECT。要想执行一个SQL*Plus命令,你只需在命令提示符后输入该命令然后敲回车,命令会自动被执行。另一方面,如果要执行SQL语句,就必须使用一个特定字符来表明你想要执行输入的语句,分号(;)或者斜线(/)都可以。使用分号的话可以直接放在输入命令的后面或者放在接下来的空行中,而斜线则必须放在接下来的空行中才可以被识别。代码清单1-8展示了如何使用这两种符号。
  代码清单1-8 执行字符的用法
  
  
  注意第5个在语句最后面加了一个斜线(/)的例子。光标移动到了下一行而不是立即执行语句命令。接下来,如果你再按一下回车键,语句就会被放入SQL*Plus的缓冲器中,但是也不执行。如果想要查看SQL*Plus缓冲器中的内容,可以使用list命令(也可以简写为l)。接下来如果你想在缓冲器中通过使用斜线(/)来执行语句[尽管斜线(/)命令本来就是这样来用的]在这里也将会返回一个错误。这是因为你最初在SQL语句的结尾敲入了一个斜线(/),而斜线(/)并不是一个有效的SQL命令,从而在语句想要执行的时候报错。
  另外一种执行命令的方法是把命令放到一个文件中。你可以在SQL*Plus之外直接用文本编辑器生成这些文件,也可以在SQL*Plus中使用EDIT命令来直接调用编辑器。如果已经有了一个文件,EDIT命令可以打开这个文件,如果没有的话就会创建新的文件。文件必须放在默认文件夹中,否则你必须指定文件的全路径。想要设定所选择的编辑器,你只需要利用命令define_ editor='//myeditor.exe'来设置预定义变量_editor。具有.sql扩展名的文件在执行的时候不必敲入扩展名,通过@或START命令都可以执行。代码清单1-9中列出了这两个命令的用法。
  代码清单1-9 执行.sql脚本文件
  
  
  SQL*Plus具有很多特性和选项,以致于多得在这里不能一一列举。就本书需要而言,这种概述就已经足够了。但是,Oracle文档对SQL*Plus的用法给出了指导,而且很多的书,比如Beginning Oracle SQL,都对SQL*Plus作了更为深入的阐述,如果感兴趣你可以参考。
  1.4 5个核心的SQL语句
  SQL语言有很多不同的语句,但在整个职业生涯中,你可能只会用到其中很少的一部分。不过你所使用的几乎其他任何产品不也是这样的吗?据说有一个统计结果是,绝大多数人都仅使用了他们常用的软件产品或编程语言所有功能的20%甚至更少。我不知道这个统计真实与否,但以我的经验来看,这似乎是很准确的。我发现同样的基本SQL语句格式在大多数应用中使用了将近20年了。极少数的人使用过SQL提供的所有功能——即使对于那些他们确实经常使用的功能也常常用得不是很恰当。显而易见,我们不可能覆盖SQL语言的所有语句以及它们的选项。本书的目的在于让你能够深入理解那些最常用的SQL语句并帮助你更高效地使用它们。
  在本书中,我们将重点讨论5个最常用的SQL语句,它们分别为SELECT、INSERT、UPDATE、DELETE以及MERGE。尽管这些核心语句都将逐个讲解,但重中之重还是SELECT语句。将这5个语句用好了将会为你在日常工作中用好SQL语言打下坚实的基础。
  1.5 SELECT语句
  SELECT语句用来从一个或多个表中或者其他数据库对象中提取数据。你应该已经很熟悉SELECT语句的基础知识了,所以我将不再从一个初学者的角度来介绍SELECT语句,而是首先回顾一下SELECT语句的执行逻辑。对于如何来写一个基本的SELECT语句你应该已经学习过了,但为了培养基本的思维模式,你要一直写出符合语法规则的高效SQL语句,你需要理解SQL语句是如何执行的。
  一个查询语句在逻辑上的处理方式可能会与实际物理处理过程大相径庭。Oracle基于查询成本的优化器(cost-based optimizer , CBO)用来产生实际的执行计划。我们在后面的章节中将会讲解优化器是干什么的,如何来实现其功能的以及为什么要进行优化。目前,我们需要关心的是优化器将会决定如何访问表、按照什么样的顺序来处理它们,以及如何将多个表联结起来及如何使用筛选器。查询的处理在逻辑上是按照特定的顺序进行的,但是,优化器所选择的物理执行计划可能会按照完全不同的顺序来实际执行这些步骤。代码清单1-10是一段包含SELECT语句的主要子句的查询片段,在其中标出了每一个子句的逻辑处理顺序。
  代码清单1-10 查询语句的逻辑处理顺序
  
  你应该立刻注意到SQL有别于其他编程语言的一点在于首先处理的并不是写在第一行的语句(SELECT语句),而是FROM子句。注意在这个代码清单中我给出了两个不同的FROM子句。标记为1.1的那个FROM子句表示的是当使用ANSI语法时的不同。我们可以把处理过程中的每一个步骤想象为生成一个临时的数据集。随着每个处理步骤的进行,这个数据集被不断地操作直到生成最终的处理结果。查询返回给调用者的就是这个最终结果数据集。
  为了更详细地了解SELECT语句的每个部分,你可以参考代码清单1-11所示的查询语句,该语句返回的结果集为下订单超过4次的女顾客的列表。
  代码清单1-11 下订单超过4次的女顾客查询语句
  
  1.5.1 FROM子句
  FROM子句列出了所查询数据的源对象。这个子句可以包含表、视图、物化视图、分区或子分区,或者你可以建立一个子查询来生成子对象。如果使用了多个源对象,其逻辑处理阶段也将会应用到每一个联结类型以及谓词ON(如步骤1.1所示)。在本书后面的章节中你将会进一步了解联结类型的更多细节,但注意在处理联结语句的时候是按照下面的顺序来进行的:
  (1) 交叉联结,也称为笛卡儿乘积;
  (2) 内联结;
  (3) 外联结。
  在代码清单1-11所示的查询例子中,FROM子句列出了两张表:customers和orders,通过customer_id列来联结。因此,当处理这一信息时,FROM子句所生成的初始数据集将会包含这两张表中customer_id相匹配的行。在本例中结果集将会包含105行。为了验证这一点,只要执行例子中的前4行,如代码清单1-12所示。
  代码清单1-12 仅通过FROM子句的部分查询语句的执行
  
  
  注意 为了使之很好地适应页面我手工调整了输出结果,实际输出结果在页面上超过105行。
  1.5.2 WHERE子句
  WHERE子句提供了一种方法,可以按照条件来限制查询最终返回结果集的行数。每个条件或者谓语都是以两个值或表达式相比较的形式出现的。比较的结果要么是匹配(值为TRUE)要么是不匹配(值为FALSE)。如果比较的结果是FALSE,那么相应的行不会被包含在最终结果集中。
  这里我需要稍微偏离一下主题,来谈一谈与这一步相关的SQL中的一个重要方面。事实上,SQL中逻辑比较的可能结果是TRUE、FALSE以及未知。当其中包含空值(null)的时候比较的结果就会是未知。空值与任何值比较或者用在表达式中都会得到空值,或者是未知。一个空值代表一个相应值的缺失,并且可能因为SQL语言中的不同部分对空值的处理不同而令人费解。关于空值是如何影响SQL语句执行的话题将会贯穿本书,但在这里我不得不先提及一下这个话题。我之前所说的还是基本正确的,一个比较的返回值将会是TRUE或者FALSE。你会发现当进行筛选的比较条件中包含空值的时候,将作为FALSE来对待。
  在我们的例子中,只有一个将结果限定为下了订单的女性消费者的谓语。如果你查看FROM子句执行之后的中间结果(见代码清单1-12),你会发现105行中仅有31行是由女性消费者所下的订单(gender = 'F')。因此,在应用了WHERE子句以后,中间结果集将从105行减少到31行。
  应用WHERE子句以后得到了更精确的结果集。注意,在这里使用的是“精确的结果集”。我的意思是说现在已经得到了能够满足你查询需求的数据行。其他子句(GROUP BY, HAVING)也许可以用来聚合并且进一步限制调用程序会接收到的最终的结果集,但需要注意的很重要的一点是,目前已经得到了查询计算最终结果所需的所有数据。
  WHERE子句的目的是限制或者减小结果集。你所使用的限制条件越少,最终返回的结果集中包含的数据就会越多。你需要返回的数据越多,执行查询的时间也就越长。
  1.5.3 GROUP BY子句
  GROUP BY子句将执行FROM和WHERE子句后得到的经过筛选后的结果集进行聚合。查询出来的结果按照GROUP BY子句中列出的表达式进行分组,来为每一个分组得出一行汇总结果。你可以按照FROM子句中所列出对象的任意字段进行分组,即使你并不想在输出结果列表中显示该列。相反,Select列表中的任何非聚合字段都必须包括在GROUP BY表达式中。
  GROUP BY子句中还可以包含两个附加的运算:ROLLUP 和CUBE。ROLLUP运算用来产生部分求和值,CUBE运算用来求得交互分类值。当你使用这两种运算中任意一个的时候,你将会得到不止一行的汇总信息。在第7章中将会对这两个运算进行更详细的讨论。
  在示例查询中,需要按照customer_id来进行分组。这就意味着对于每一个唯一的customer_id只会返回一行值。在WHERE子句执行后所得到的代表下订单的女性消费者的31行订单中,有11个独特的customer_id值,如代码清单1-13所示。
  
  
  代码清单1-13 截至GROUP BY子句的部分查询执行
  
  
  你会发现查询的结果是经过分组的,但并没有排序。表面上看结果好像是按照order_ct字段排序的,但这仅仅是个巧合而不是确定的行为。需要记住的很重要的一点是:GROUP BY子句并不确定结果数据的排序。如果你需要结果按照特定的顺序排列,则必须指定一个order by子句。
  1.5.4 HAVING子句
  HAVING子句将分组汇总后的查询结果限定为只有该子句中的条件为真的数据行。除非你使用HAVING子句,否则将返回所有的汇总行。事实上,GROUP BY子句和HAVING子句的位置是可以互换的,谁先谁后都无关紧要。但是,似乎在编码中将GROUP BY子句放在前面更有意义一些,因为GROUP BY子句在逻辑上是先执行的。从本质上来说,HAVING子句是在GROUP BY子句执行后用来筛选汇总值的第二个WHERE子句。
  在我们的查询例子中,HAVING子句HAVING COUNT(o.order_id) > 4,将分组数据从11行减少到2行。这一点你可以通过查看GROUP BY子句应用后返回的结果行来确认,如代码清单1-13所示。注意仅有146和147号消费者所下的订单数超过4次。这样就产生了组成最终结果集的两行数据。
  1.5.5 SELECT列表
  SELECT列表列出查询的返回最终结果集中需要显示哪些列。这些列可以是数据表中一个实际的列、一个表达式,或者甚至是一个SELECT语句的结果,如代码清单1-14所示。
  代码清单1-14 展现SELECT列表各种可能情况的查询实例
  SQL> select.customer_id, c.cust_first_name||''||c.cust_last_name,
  
  
   .
  当使用另外一个SELECT语句来产生结果中的一列的值的时候,这个查询必须只能返回一行一列的值。这种类型的子查询被称为标量子查询。尽管这可能是一个非常有用的语法,但需要牢记于心的是标量查询在结果集中的每一行结果产生时都要执行一遍。在某些情况下可以进行优化以减少标量子查询的重复执行,但更糟糕的场景是每一行都需要标量子查询执行。你可以想象如果你的结果集中有几千行甚至上百万行数据的时候所需要付出的查询代价!在后面的章节中我们还将回顾标量子查询并讨论如何更好地来使用它们。
  在SELECT列表中你还有可能用到的一个选项是DISTINCT子句。在例子中并没有使用它,但我想要简要地提及一下。DISTINCT子句用来在其他子句执行完毕以后从结果集中去除重复的行。
  SELECT列表执行完以后,你就得到了最终的查询结果集。所剩的唯一需要做的事情,如果包含了的话,就是将查询结果集按照所需的顺序排序。
  1.5.6 ORDER BY子句
  ORDER BY子句用来对查询最终返回的结果集进行排序。在本例中,需要按照orders_ct和customer_id进行排序。orders_ct这一列是通过GROUP BY子句中的COUNT聚合函数计算得到的值。如代码清单1-13中所示,有两个消费者的订单超过4个。由于这两个消费者的订单数都是5份,orders_ct这一列的值是相同的,所以要由第二个排序列来确定最终结果的显示顺序。如代码清单1-15中所示,该查询的最终经过排序的输出结果是按照customer_id排序的两行数据集。
  代码清单1-15 示例查询的最终输出
  
  当输出结果需要排序的时候,Oracle必须在其他所有子句都执行完之后按照指定的顺序对最终结果集进行排序。需要排序的数据量大小是非常重要的。我这里所说的大小是指结果集中所包含的总字节数。你可以通过用行数乘以每一行的字节数来估计数据集的大小。每行所包含的字节数通过将选择列表中包含的每一列的平均长度相加来确定。
  上面的查询实例在选择列表中仅需要列出customer_id 和orders_ct两列的值。我们可以估算每一行输出值的字节数为10。在第6章中我将阐述从哪里能找到优化器所估计的值。因此,如果我们在结果集中只有两行数据,排序的大小实际上是很小的,大约20字节。请记住这仅仅是估算,但这样的估算也是很重要的。
  较小的排序会完全在内存中来实现,而较大的排序将不得不使用临时磁盘空间来完成。如你可能推断的那样,在内存中完成的排序比必须使用磁盘的排序要快。因此,当优化器估算排序数据的影响时,它必须要考虑排序数据集的大小,以此来调整如何能够以最有效的方法来获得查询的结果。一般来说,排序是查询过程中开销相当大的一个处理步骤,尤其是当返回结果集很大的时候。
  1.6 INSERT语句
  INSERT语句用来向表、分区或视图中添加行。可以向单表或者多个表方法中添加数据行。单表插入将会向一个表中插入一行数据,这行数据可以显式地列出插入值也可以通过一个子查询来获取。多表插入将会向一个或多个表中插入行,并且会通过子查询获取值来计算所插入行的值。
  1.6.1 单表插入
  代码清单1-16中的第一个例子阐明了使用values子句实现的单表插入。每一列的值都显式地输入。如果你要插入表中所定义的所有列的值……

去天猫旗舰店查看商品详情:

Oracle SQL高级编程

posted on 2013-05-23 12:33  IT技术畅销书  阅读(701)  评论(1编辑  收藏  举报

导航