Sql：基础

本文根据书籍《sql必知必会》，整理而成。

基本概念

数据库 database：保存有组织的数据的容器，通常是一个文件或一组文件。

数据库管理系统 DBMS：又称数据库软件，数据库是通过 DBMS 创建和操纵的容器。

表 table：某种特定类型数据的结构化清单。

模式 schema：关于数据库和表的布局及特性的信息。

列 column：表中的一个字段。所有的表都是由一个或多个列组成的。

行 row：表中的一个记录，有时又称为数据库记录 record。

主键 primary key：一列（或一组列），其值能够唯一标识表中每一行。

关键字 keyword：作为 SQL 组成部分的保留字。

子句 clause：SQL 语句由子句构成，有些子句是必需的，有些则是可选的。一个子句通常由一个关键字加上所提供的数据组成。例如 SELECT 语句中的 FROM 子句。

SQL 是结构化查询语言（structured query language）的缩写。SQL 是一种专门用来与数据库沟通的语言。

检索数据

基本查询用 SELECT 语句

SELECT DISTINCT prod_id, prod_name FROM Products LIMIT 5 OFFSET 5;

注意：DISTINCT 关键字作用于所有的列。LIMIT 5 OFFSET 5 指示 MySQL 等 DBMS 返回从第 5 行起的 5 行数据。第一个数字是指从哪儿开始，第二个数字是检索的行数。

排序数据

SELECT prod_id, prod_price, prod_name FROM Products ORDER BY prod_price DESC, prod_name;

注意：ORDER BY 子句必须是 SELECT 语句中的最后一条子句。同时使用 ORDER BY 和 WHERE 时，应该让 ORDER BY 位于 WHERE 之后。

过滤数据

filter condition 提取表数据的子集。

可以通过

关系运算 >=< 空值检查 IS NULL
逻辑运算 AND NOT IN NOT 等

来过滤数据。

关键字 DISTINCT 关键字，指示数据库只返回不同的值。DISTINCT 关键字作用于所有的列。

搜索数据

通配符 wildcard：用来匹配值的一部分的特殊字符。

搜索模式 search pattern：由字面值、通配符或两者组合构成的搜索条件。

谓词 predicate：操作符何时不是操作符？答案是，它作为谓词时。从技术上说，LIKE 是谓词而不是操作符。虽然最终结果是相同的。

常用的通配符有百分号 % 下划线 _ 方括号 [ ] 等。

计算字段

拼接字段，concat 就是一个函数

SELECT
    Concat(
        vend_name,
        ' (',
        vend_country,
        ')'
    ) AS vend_title
FROM
    Vendors
ORDER BY
    vend_name;

执行算术计算

SELECT
    prod_id,
    quantity,
    item_price,
    quantity * item_price AS expanded_price
FROM
    OrderItems
WHERE
    order_num = 20008;

其他算术运算符也可以使用。

汇总数据

首先讲讲函数，函数在多种编程语言里面皆有定义，SQL 中定义和它们差不多。

函数主要分为文本处理函数、日期和时间处理函数、数值处理函数。重点是聚集函数。

聚集函数 aggregate function：对某些行运行的函数，计算并返回一个值。常用的有：

AVG 求平均值，例如：SELECT AVG(prod_price) AS avg_price FROM Products;
COUNT 计数，例如：SELECT COUNT(*) AS num_cust FROM Customers;
MAX MIN 最大值和最小值，例如：SELECT MAX(prod_price) AS max_price FROM Products;
SUM 指定列的和，例如：SELECT SUM(quantity) AS items_ordered FROM OrderItems;

上面这些函数可以组合使用。

分组数据

汇总表内容的子集。主要是 GROUP BY 子句和 HAVING 子句。

例如：

SELECT
    vend_id,
    COUNT(*) AS num_prods
FROM
    Products
GROUP BY
    vend_id;

GROUP BY 子句指示 DBMS 分组数据，然后对每个组而不是整个结果集进行聚集。

关于 GROUP BY 的一些重要的规定。

一般用 HAVEING 子句过滤分组。HAVEING 分句非常类似于 WHERE。唯一的差别是，WHERE 过滤行，而 HAVING 过滤分组。二者句法是相同的。WHERE 在数据分组前进行过滤，HAVING 在数据分组后进行过滤。

SELECT
    cust_id,
    COUNT(*) AS orders
FROM
    Orders
GROUP BY
    cust_id
HAVING
    COUNT(*) >= 2;

GROUP BY 和 ORDER BY 的组合使用。

SELECT
    order_num,
    COUNT(*) AS items
FROM
    OrderItems
GROUP BY
    order_num
HAVING
    COUNT(*) >= 3
ORDER BY
    items,
    order_num;

注意子句的顺序。

子查询

子查询 subquery，即嵌套在其他查询中的查询。在 SELECT 语句中，子查询总是从内向外处理。

SELECT cust_name, cust_contact
FROM Customers
WHERE cust_id IN (
    SELECT cust_id
    FROM orders
    WHERE order_num IN (
        SELECT order_num
        FROM OrderItems
        WHERE prod_id = 'RGAN01'
    )
);

作为计算字段使用子查询。

SELECT cust_name, cust_state
    , (
        SELECT COUNT(*)
        FROM Orders
        WHERE Orders.cust_id = Customers.cust_id
    ) AS orders
FROM Customers
ORDER BY cust_name;

以上是常见的子查询。

组合查询

在数据查询中执行联结表 join。

笛卡儿积 cartesian product：由没有联结条件的表返回的结果为笛卡儿积。检索出的行的数目将是第一个表中的行数乘以第二个表中的行数。

例如：SELECT vend_name, prod_name, prod_price FROM Vendors, Products;

这样查询的结果一般不是我们想要的。

内联结

等值联结 equijoin：又称内联结 inner join，它基于两个表之间的相等测试。

带条件的联结，这是简单语法

SELECT vend_name, prod_name, prod_price
FROM Vendors, Products
WHERE Vendors.vend_id = Products.vend_id;

带条件的联结，这是标准语法

SELECT vend_name, prod_name, prod_price
FROM Vendors
    INNER JOIN Products ON Vendors.vend_id = Products.vend_id;

注意 inner join 可以多次使用连接多个表。

SELECT prod_name, vend_name, prod_price, quantity
FROM Products 
INNER JOIN Vendors ON Products.vend_id = Vendors.vend_id
INNER JOIN OrderItems ON OrderItems.prod_id = Products.prod_id
WHERE order_num = 20007;

联结多个表

SELECT prod_name, vend_name, prod_price, quantity
FROM OrderItems, Products, Vendors
WHERE (Products.vend_id = Vendors.vend_id
    AND OrderItems.prod_id = Products.prod_id
    AND order_num = 20007);

表别名：表别名只能在查询执行中使用。与列别名不一样，表别名不返回到客户端。

自联结

self-join

SELECT c1.cust_id, c1.cust_name, c1.cust_contact
FROM Customers c1, Customers c2
WHERE c1.cust_name = c2.cust_name
    AND c2.cust_contact = 'Jim Jones';

许多 DBMS 处理联结远比处理子查询快得多。

自然联结

natural join

SELECT C.*, O.order_num, O.order_date, OI.prod_id, OI.quantity
    , OI.item_price
FROM Customers C, Orders O, OrderItems OI
WHERE (C.cust_id = O.cust_id
    AND OI.order_num = O.order_num
    AND prod_id = 'RGAN01');

无论何时对表进行联结，应该至少有一列不止出现在一个表中（被联结的列）。标准的联结返回所有数据，相同的列甚至多次出现。自然联结排除多次出现，使每一列只返回一次。

外联结

outer join

这是左联结

SELECT Customers.cust_id, Orders.order_num
FROM Customers
    LEFT JOIN Orders ON Customers.cust_id = Orders.cust_id;

这是右联结

SELECT Customers.cust_id, Orders.order_num
FROM Customers
    RIGHT JOIN Orders ON Orders.cust_id = Customers.cust_id;

许多联结将一个表中的行与另一个表中的行相关联，但有时候需要包含没有关联行的那些行。

利用 UNION，可以把多条查询的结果作为一条组合查询返回。

内联结是两张表中具有数据对应时才会产生一行记录。外联结则是以主表为准根据附表产生对应的记录。

插入更新删除数据

插入数据

INSERT INTO Customers (cust_id, cust_name, cust_address, cust_city, cust_state
    , cust_zip, cust_country, cust_contact, cust_email)
VALUES ('1000000006', 'Toy Land', '123 Any Street', 'New York', 'NY'
    , '11111', 'USA', NULL, NULL);

插入检索出的数据

INSERT INTO Customers (cust_id, cust_contact, cust_email, cust_name, cust_address
    , cust_city, cust_state, cust_zip, cust_country)
SELECT cust_id, cust_contact, cust_email, cust_name, cust_address
    , cust_city, cust_state, cust_zip, cust_country
FROM CustNew;

上面的 INSERT SELECT 中 SELECT 语句可以包含 WHERE 子句，以过滤插入的数据。

INSERT 通常只插入一行。要插入多行，必须执行多个 INSERT 语句。INSERT SELECT 是个例外，它可以用一条 INSERT 插入多行，不管 SELECT 语句返回多少行，都将被 INSERT 插入。

从一个表复制到另一个表

CREATE TABLE CustCopy AS
SELECT * FROM Customers;

更新数据

UPDATE customers
SET cust_email = 'kim@thetoystore.com'
WHERE cust_id = '1000000005';

删除数据

DELETE FROM Customers
WHERE cust_id = '1000000006';

视图

视图是虚拟的表。与包含数据的表不一样，视图只包含使用时动态检索数据的查询。

因为视图不包含数据，所以每次使用视图时，都必须处理查询执行时需要的所有检索。如果你用多个联结和过滤创建了复杂的视图或者嵌套了视图，性能可能会下降得很厉害。因此，在部署使用了大量视图的应用前，应该进行测试。

创建视图

CREATE VIEW ProductCustomers
AS
SELECT cust_name, cust_contact, prod_id
FROM Customers, Orders, OrderItems
WHERE Customers.cust_id = Orders.cust_id
    AND OrderItems.order_num = Orders.order_num;

视图的查询和普通的 SELECT 语句一样。

存储过程

存储过程就是为以后使用而保存的一条或多条 SQL 语句。可将其视为批文件，虽然它们的作用不仅限于批处理。

事务处理

使用事务处理 transaction processing，通过确保成批的 SQL 操作要么完全操作，要么完全不执行，来维护数据库的完整性。

事务处理相关的术语：

事务 transaction 指一组 SQL 语句；
回退 rollback 指撤销指定 SQL 语句的过程；
提交 commit 指将未存储的 SQL 语句结果写入数据库表；
保留点 savepoint 指事务处理中设置的临时占位符 placeholder，可以对它发布回退（与回退整个事物处理不同）。

事务处理用来管理 INSERT UPDATE DELETE 语句。

游标

游标 cursor 是一个存储在 DBMS 服务器上的数据库查询，它不是一条 SELECT 语句，而是被该语句检索出来的结果集。在存储了游标之后，应用程序可以根据需要滚动或浏览其中的数据。

有时，需要在检索出来的行中前进或后退一行或多行，这就是游标的用途所在。

高级 SQL 特性

约束

约束 constraint：管理如何插入或处理数据库的规则。

主键 primary key：是一种特殊的约束，用来保证一列（或一组列）中的值是唯一的，而且永不改动。

外键是表中的一列，其值必须列在另一表的主键中。外键是保证引用完整性的极其重要的部分。

唯一约束 UNIQUE 可以用于限制某一列的值不重复。

检查约束用来保证一列（或一组列）中的数据满足一组指定的条件：

检查最小或最大值。例如，防止 0 个物品的订单；
指定范围。例如，保证发货日期大于等于今天的日期；
只允许特定的值。

索引

创建索引

CREATE INDEX prod_name_ind ON PRODUCTS (prod_name);

触发器

触发器是特殊的存储过程，它在特定的数据库活动发生时自动执行。触发器可以与特定表上的 INSERT UPDATE DELETE 相关联。

综合查询：

显示所有的库：show database;

使用名为 test 的库：use test;

显示库中所有的表：show tables;

显示表的所有信息：describe pet;

参考：

mysql 官方文档

posted @ 2019-06-24 08:54 colin220 阅读(219) 评论(0) 收藏举报

刷新页面返回顶部