数据库

数据库

【一】什么是数据库

一种用于存储、组织和管理大量数据的系统,它将数据以一定的结构形式组织起来,并提供了一套标准的操作接口(如 SQL 语言),使得用户能够有效地查询、更新、插入和删除数据。

【二】数据库的本质

  • 数据库其实就是一块基于网络通信的应用程序
  • 存储数据的基于TCP协议的客户端和服务端的服务器

【三】数据库的分类及对应的主流数据库

  • 关系型数据库
    • 主流数据库:Oracle、MySQL、Microsoft SQL Server、PostgreSQL、SQLite 等。
    • 关系型数据库采用表格的形式表示数据,基于 SQL 查询语言,强调数据之间的表结构关系以及 ACID(原子性、一致性、隔离性、持久性)事务处理。
  • 非关系型数据库(NoSQL Database)
    • 分布式文档型数据库(如 MongoDB):如MongoDB、Couchbase、CouchDB。
    • 键值对型数据库(如 Redis、Memcached):如Redis、Amazon DynamoDB。
    • 列族数据库(如 HBase):Apache HBase、Google Bigtable。
    • 图数据库(如 Neo4j):Neo4j、JanusGraph。
    • 时间序列数据库(如 InfluxDB):InfluxDB、OpenTSDB。
    • 对象数据库(如 OrientDB):OrientDB、ObjectDB。
    • NoSQL 数据库通常不强求严格的表结构,而是灵活的数据存储和查询方式,适用于大规模分布式系统和实时大数据场景。

【四】数据库操作

【1】创建数据库

create databases 数据库名;

【2】查看数据库

show databases;  -- 查看所有数据库
show create database 数据库名; -- 查看数据库的建库sql语句

【3】修改数据库

alter database 数据库名 [character set 编码字符集];

【4】删除数据库

  • 删除数据库后,数据库中存储的所有数据表和数据也将一同被删除,而且不能恢复。
drop database [if exists] 数据库名;

【5】切换到指定库

use 数据库名;

【五】表操作

【1】创建表

create table  表名 (
    字段名1    数据类型[ ( 存储空间 )   字段约束 ],
    .....
    primary key(一个 或 多个 字段名) 
)

【2】查看表

  • 列出当前数据库中所有的数据表
show tables;
  • 查看指定的表
show create table 表名;
  • 查看当前表的详细信息
describe 表名;
  • 查看建表语句
show create table 表名 \G;

【3】修改表

  • 修改表的字段类型 modify(只能改类型不能改名字)
alter table 表名 modify 字段名 字段类型(宽度);
  • change(名字类型都可)
alter table 表名 change 字段名 字段类型(宽度);
  • 修改表名字重命名
alter table 原表名 rename 新表名;
  • 添加字段默认是尾部追加字段
alter table 表名 add 字段名 字段类型;
  • 指定追加位置
alter table 表名 add 字段名 字段类型 after 原字段名;
  • 指定头部添加字段
alter table 表名 add 字段名 字段类型 first;
  • 删除字段
alter table 表名 drop 字段名;

【4】删除表

drop table 表名;

【六】约束条件

【1】非空约束(not null)

  • not null约束的字段不能为 NULL 值,必须赋具体数据
create table b1(
  id int(10) not null,
  ...
);

【2】唯一约束(unique)

  • unique约束的字段具有唯一性,不可重复,但是可以为空(null)。
alter table b2 modify cid int unique;

【3】主键约束(primary key)

  • 单一主键
create table b1(
	id int(10),
....
  primary key(id)
);
  • 复合主键
create table b2(
	id int(10);
  name varchar(32);
 ....
  primary key(id,name)
);
  • 自增字段auto_increment
create table db(
  id int(10) primary key auto_increment,
  name varchar(32)
);

【4】外键约束(foreign key)

create table 表名2(
	字段名1 字段类型1 约束条件1 comment 注释1,
	字段名2 字段类型2 约束条件2 comment 注释2,
  foreign key(在表名2中显示的字段名) references 表名1(表明1中需要建立外键关系的字段名)
);
  • 级联更新和级联删除
on update cascade  # 级联更新
on delete cascade  # 级联删除

【七】表数据操作

【1】增加数据

insert into 表名(字段名) value(值)

【2】修改数据

update  表名 set  字段名=值  where 条件

【3】删除数据

delete from 表名  where 条件

【4】查看数据

select * from 表名 where 条件

【八】筛选过滤条件

【1】where

select * 
from db 
where 条件;

【2】group by(分组)

  • 用于计数、平均、最高、最低等函数
select * 
from db 
group by class;
  • group_concat

  • 聚合函数:group_concat- 获得分组之后的具体的值

  • 关键字 where 和 group by 同时出现的时候,group by 必须在 where 后面

    • where 先对整体数据进行过滤
    • group by 再对数据进行分组

【3】having(分组之后筛选)

select * 
from db 
group by class
having  ...

【4】distinct(去重)

select distinct age from db;

【5】order by(排序)

  • order by : 默认是升序
  • asc 默认可以省略不写 ---> 修改降序
  • desc : 降序
select * from db order by age;

【6】 limit(限制展示条数)

  • limit x,y : 第一个参数是起始位置,第二个是条数
select * from emp limit 10;
select * from emp limit 0,6;

【7】正则

 属性名 REGEXP '匹配方式'
选项 说明 例子 匹配值示例
^ 匹配文本的开始字符 ‘^b’ 匹配以字母 b 开头的字符串 book、big、banana、bike
$ 匹配文本的结束字符 ‘st$’ 匹配以 st 结尾的字符串 test、resist、persist
. 匹配任何单个字符 ‘b.t’ 匹配任何 b 和 t 之间有一个字符 bit、bat、but、bite
* 匹配前面的字符 0 次或多次 ‘f*n’ 匹配字符 n 前面有任意个字符 f fn、fan、faan、abcn
+ 匹配前面的字符 1 次或多次 ‘ba+’ 匹配以 b 开头,后面至少紧跟一个 a ba、bay、bare、battle
? 匹配前面的字符 0 次或1次 ‘sa?’ 匹配0个或1个a字符 sa、s
字符串 匹配包含指定字符的文本 ‘fa’ 匹配包含‘fa’的文本 fan、afa、faad
[字符集合] 匹配字符集合中的任何一个字符 ‘[xz]’ 匹配 x 或者 z dizzy、zebra、x-ray、extra
[^] 匹配不在括号中的任何字符 ‘[^abc]’ 匹配任何不包含 a、b 或 c 的字符串 desk、fox、f8ke
字符串 匹配前面的字符串至少 n 次 ‘b{2}’ 匹配 2 个或更多的 b bbb、bbbb、bbbbbbb
字符串 匹配前面的字符串至少 n 次, 至多 m 次 ‘b{2,4}’ 匹配最少 2 个,最多 4 个 b bbb、bbbb

【九】多表操作

【1】子查询

  • =返回一条数据
select * from 表1 where id = (select id from 表2 where 条件)
  • in 返回多条数据
select * from 表1 where id in (select id from 表2 where 条件)

【2】联表查询

  • inner join(内连接)
select *
from 表1 inner join 表2 on 表1.字段名=表2.字段名
  • left join(左连接)
select *
from 表1 left join 表2 on 表1.字段名=表2.字段名
  • right join(右连接)
select *
from 表1 right join 表2 on 表1.字段名=表2.字段名
  • union(全连接)
select * from 表1 left join 表2 on 表1.字段名=表2.字段名
union
select * from 表1 right join 表2 on 表1.字段名=表2.字段名

【3】关键字exist

  • 只返回布尔值
  • 返回true时,外层查询语句执行
  • 返回false时,外层查询语句不执行
select * from db where exists (select age from db1 where age > 18);

【十】触发器

【1】什么是触发器

  • 在满足对表数据进行增删改的情况下,自动触发的功能,称为触发器

  • 触发器可以作为一种数据库的约束,用于保证数据的完整性和一致性。

【2】触发器的特点

  • 触发器通常与表一起创建、修改和删除。
  • 触发器可以在特定的数据操作之前或之后触发执行。
  • 触发器可以根据用户定义的条件判断是否执行相应的逻辑。
  • 触发器可以调用存储过程、函数、触发其他触发器等,实现更复杂的业务逻辑。

【3】使用情况

  • 增前
create trigger 触发器的名字 
before insert on 表名 
for each row 
begin
	SQL语句
end
  • 增后
create trigger 触发器的名字 
after insert on 表名 
for each row 
begin
	SQL语句
end
  • 删前
create trigger 触发器的名字 
before delete on 表名 
for each row 
begin
	SQL语句
end
  • 删后
create trigger 触发器的名字 
after delete on 表名 
for each row 
begin
	SQL语句
end
  • 改前
create trigger 触发器的名字 
before update on 表名 
for each row 
begin
	SQL语句
end
  • 改后
create trigger 触发器的名字 
after update on 表名 
for each row 
begin
	SQL语句
end

【4】删除触发器

drop 触发器的名字;

【十一】索引

【1】什么是索引

  • 索引(在MySQL中也叫做“键(key)”)是存储引擎用于快速找到记录的一种数据结构,这也是索引最基本的功能。

  • 简单的说,数据库索引类似于书前面的目录,能加快数据库的查询速度。

【2】索引的类型

  • 创建主键约束(PRIMARY KEY)、唯一约束(UNIQUE)、外键约束(FOREIGN KEY)时,会自动创建 对应列的索引。

  • foreign key:不是用来加速查询的

  • primary key/unique key:不仅可以加速查询速度,还具有对应的约束条件

  • index key:只有加速查询速度的功能

【3】索引操作

  • 创建索引
create index  索引名 on 表名(字段名);
  • 查看索引
show index from 表名;
  • 删除索引
drop index 索引名 on 表名

【4】聚集索引(主键索引)

  • 聚集索引(Clustered Index)是关系型数据库中的一种索引类型,它决定了表中数据的物理存储顺序。
  • 聚集索引对表进行了重新组织,使得数据按照聚集索引的键值顺序存储在磁盘上。
  • 由于聚集索引决定了数据的物理存储顺序,因此通过聚集索引可以快速地找到特定范围内的数据
  • MySQL的聚簇索引是基于B+树的数据结构实现的,它会把数据存储在索引的叶子节点上,叶子节点之间按顺序链接,使得按主键进行搜索时速度最快。
  • 如果没有主键,如果按主键搜索,速度是最快的。

特点

  • 查询速度很快。

  • 聚集索引的键值必须是唯一的,不允许重复值存在。

  • 如果表中没有定义聚集索引,那么表的数据存储顺序将按照物理地址来存储。

  • 表不建立主键,也会有个隐藏字段是主键,是主键索引。

  • 主键索引对于按照主键进行查询的性能非常高。

语法

  • 数据列不允许重复,不允许为NULL,一个表只能有一个主键。
ALTER TABLE table_name ADD PRIMARY KEY (column);

【5】唯一索引(unique)

  • 唯一索引是指该索引的所有值都是唯一的,不允许出现重复值。
ALTER TABLE table_name ADD UNIQUE KEY index_name (column);

【6】组合索引(联合索引)

  • 组合索引是一种由两个或更多列组成的索引。
  • 当查询涉及多个列时,组合索引可以大大提高查询性能。
ALTER TABLE table_name ADD INDEX index_name (column1, column2, ...);

【十二】视图

【1】什么是视图

  • 视图就是通过查询得到一张虚拟表,然后保存下来,下次可以直接使用

【2】视图的优点

  • 简化复杂查询:
    • 视图可以对基本表进行复杂的操作,包括连接多个表、过滤条件、聚合函数等。
    • 通过定义视图,可以将复杂的查询逻辑封装到一个简单的视图中,使用户能够以更简洁明了的方式进行数据检索。
  • 数据安全性:
    • 视图可以限制用户对数据的访问权限,通常用于隐藏敏感数据或只提供部分数据给特定的用户。
    • 通过定义视图并设置相应的权限,可以保护数据的安全性,防止未经授权的用户访问敏感信息。
  • 数据完整性:
    • 视图可以用于实现数据完整性约束,即对数据的有效性进行验证。
    • 通过定义视图并添加计算列、过滤条件等约束,可以确保所返回的数据满足一定的条件,提高数据的准确性和一致性。
  • 逻辑数据独立性:
    • 视图使得应用程序与数据之间解耦,即应用程序不需要了解底层表结构的细节。
    • 这样,当底层数据库发生变化时(如表结构修改),只需调整底层视图的定义而无需修改应用程序,从而提高系统的可维护性和扩展性。
  • 性能优化:
    • 物化视图是一种缓存机制,可以将视图的查询结果存储在磁盘上,以提高查询性能。
    • 当基本表的数据频繁变动时,物化视图可以减少查询的计算开销和响应时间,提升系统的性能。

【3】使用视图

  • 创建视图
CREATE VIEW my_view AS SELECT column1, column2 FROM my_table WHERE condition;
# condition 是过滤条件。
  • 使用视图
SELECT * FROM my_view;
  • 更新视图
UPDATE my_view SET column1 = value1 WHERE condition;
  • 删除视图
DROP VIEW my_view;

【4】总结

  • 创建视图咋硬盘上只会有表结构,没有表数据
    • 表数据还是来自之前的表
  • 视图一般只用来查询
    • 不建议对视图内的数据进行更改,有可能会对原始数据产生影响
  • 视图的使用频率并不高
    • 当创建了较多视图后,会造成数据的难以维护

【十三】存储过程

【1】什么是存储过程

  • 存储过程是在关系型数据库中存储的一组预定义的SQL语句集合,可以接收参数并返回结果。
  • 它们被封装在数据库服务器中,并由应用程序通过调用存储过程来执行特定的数据库操作。

【2】存储过程的特点

  • 代码复用 : 存储过程只需要编写一次,可以在多个地方被调用,提高了代码的复用性。
  • 数据库性能优化 : 存储过程在数据库中被编译、优化和缓存,可以减少网络传输开销,提高查询性能。
  • 安全性增强: 存储过程可以限制直接对表的访问权限,通过存储过程来进行数据操作,可以为数据库提供更好的安全性。

【3】使用存储过程

  • 定义存储器
create procedure 存储器的名字(形参1,形参2...)
begin
	sql 代码
end
  • 调用
call 存储器的名字();
  • 查看存储过程具体信息
show create procedure pro1;
  • 查看所有存储过程
show procedure status;
  • 删除存储过程
drop procedure pro1;

【十四】事务

【1】什么是事务

  • 开启一个事务可以包含多条语句,这些语句要么同时成功,要么都不成功
  • 事务是指一系列相关操作的集合,这些操作被视为一个不可分割的工作单元。
  • 事务的目标是确保在多个操作中的每一个都要么全部成功执行,要么全部失败回滚。
    • 即事务的原子性

【2】事务的四大特性

  • 原子性(Atomicity):事务中的所有操作被视为不可分割的整体,要么全部完成,要么全部不执行,没有部分成功的可能。
  • 一致性(Consistency):事务开始前和结束后,数据库都必须处于一致状态。这意味着事务的操作不会违反任何实体完整性、参照完整性和用户定义的完整性约束。
  • 隔离性(Isolation):在同一时间点上,不同的事务看到的是数据库的不同视图,彼此之间互不影响,避免了数据竞态条件(Race Condition)的发生。
  • 持久性(Durability):一旦事务被提交,无论后续发生什么情况(如系统故障、电源中断等),事务对数据库的修改都会永久保存下来,不会丢失。

【3】事务的作用

  • 事务的主要作用在于在多个并发操作下保证数据的一致性和完整性,特别是在分布式系统和多用户环境中。
  • 通过控制事务边界,可以防止脏数据(Dirty Data)的产生,确保每个操作都在数据库中按照预期的方式执行。

【4】如何开启事务和事务回滚

  • 开启事务(以MySQL为例):

    START TRANSACTION;
    
    • 提交事务(MySQL):
    COMMIT;
    
  • 回滚事务(MySQL):

    ROLLBACK;
    

    当事务处理过程 ** 现错误或者操作未按预期执行时,通常会调用 ROLLBACK 来撤销已执行的所有操作,回到事务开始前的状态。

【5】结束事务

  • 不论是提交还是回滚事务,都需要通过特定的语句来结束事务。
START TRANSACTION; -- 开始事务

-- 执行事务操作
INSERT INTO 表名 (列1, 列2, 列3) VALUES (值1, 值2, 值3);
UPDATE 表名 SET 列1 = 值1 WHERE 条件;
DELETE FROM 表名 WHERE 条件;

COMMIT; -- 提交事务,将修改永久保存
OR
ROLLBACK; -- 回滚事务,撤销所有修改

END; -- 结束事务

【6】数据库事务隔离机制

  • Read uncommitted(读未提交)
    • 存在脏读、不可重复读和幻读问题。
  • Read committed(读已提交)
    • 解决了脏读问题,但仍可能出现不可重复读和幻读。
  • Repeatable read(可重复读取)
    • 解决了脏读和不可重复读问题,但仍可能出现幻读。
  • Serializable(串行化)
    • 解决了脏读、不可重复读和幻读问题,但在效率方面有所牺牲。

【十五】数据库三大读现象

  • 幻读(Read Ghost):在一个事务中,如果两个查询返回的行数不同,即使它们使用了相同的 WHERE 子句和排序条件,这称为幻读。幻读通常发生在对行数可变的表(如日志表)上。
  • 不可重复读(Phantom Reads):在同一事务内部,多次读取同一行数据,发现结果不一致,原因是第二次读取时发生了新的插入操作,这种现象称为不可重复读。
  • 读已提交(Read Committed):这是大多数事务隔离级别的默认行为,在这一级别下,事务看到的都是已经提交的数据,但无法阻止其他事务在当前事务执行期间进行插入或更新操作,可能导致不可重复读和幻读的现象。

【十六】数据库锁机制

  • 锁保证并发的多个事务同一时间只有一个能运行
    • 会一定程度上降低程序的运行效率
    • 但是能大大提升数据的安全性。

【1】按粒度分类

1.表级锁
  • 每次操作锁住整张表。锁定粒度大,发生锁冲突的概率最高,并发度最低。应用在MyISAM、 InnoDB、 BDB 等存储引擎中。
2.行级锁
  • 每次操作锁住一行数据。锁定粒度最小,发生锁冲突的概率最低,并发度最高。应用在InnoDB 存储引擎中。
3.页级锁
  • 页级锁:每次锁定相邻的一组记录,锁定粒度界于表锁和行锁之间,开销和加锁时间界于表锁和行锁之间,并发度一般。应用在BDB 存储引擎中。

【2】按级别分类

1.共享锁(读锁)

语法:

select … lock in share mode

若事务T对记录A加上共享锁,则事务T可以读A但不能修改A,其他事务只能再对A加共享锁,而不能加排它锁,直到事务T释放A上的共享锁。这保证了其他事务可以读A,但在事务T释放A上的共享锁之前不能对A做任何修改

2.排它锁(写锁、独占锁)

语法:

select … for update

若事务T对记录A加上排它锁,事务T可以读A也可以修改A,其他事务不能再对A加任何锁(共享锁/排它锁),直到T释放A上的排它锁。这保证了其他事务在事务T释放A上的排它锁之前不能再读取和修改A

【3】按使用方式分类

1.悲观锁
  • 顾名思义指的是对外界将要进行的数据修改操作持悲观态度
  • 因此,在整个数据处理过程中,将数据处于锁定状态。
  • 现在由于互联网的高并发架构,即使加上悲观锁也无法保证数据不被外界修改,因此不推荐使用。
2.乐锁
  • 相对悲观锁而言,乐观锁假设认为数据一般情况下不会造成冲突
  • 所以在数据进行提交更新的时候,才会正式对数据的冲突与否进行检测
  • 如果发现冲突了,则让返回用户错误的信息,让用户决定如何去做。
  • 通常乐观锁的实现是在表中加一个字段(可能是时间戳或版本号)
  • 在写入的时候会查询一下版本号
    • 如果版本号没有改变,就写入数据库并同时改变版本号。
  • 从本质上来说,乐观锁并没有加锁
    • 所以效率会大大提升
    • 但也有一定的缺陷,就是可能导致一部分任务的写入失败。

【十七】数据库的三大范式

  • 范式就是我们在设置数据库的表时,一些共同需要遵守的规范

  • 掌握这些设计时的范式,可以让我们在项目之初,设计库的表结构更加合理和优雅

  • 三大范式之间,是逐级递进的关系,也就是说后一个范式是在前一个范式的基础上推行。

【1】第一范式 1NF

  • 定义:一个关系模式必须满足属性域内的值都是原子的,即不可再分,不存在重复的值集。
  • 意义:消除了列值的重复,确保了数据的最小单位是单一且有意义的信息项,降低了数据冗余,有助于提高数据的一致性。

【2】第二范式 2NF

  • 定义:在1NF的基础上,关系模式中的非主键依赖于整个主键(键集合),而不仅仅是单个属性。
  • 意义:消除部分依赖,使得非关键属性与键之间存在完全函数依赖,减少数据冗余并提高数据 ** 性。

【3】第三范式 3NF

  • 定义:在2NF的基础上,关系模式中没有任何非主键属性传递依赖于其他非主键属性(也称为三元组依赖)。
  • 意义:消除传递依赖,保证数据的逻辑 ** 性,避免因非关键属性的变化导致冗余信息的不一致。
posted @ 2024-07-03 09:08  蓝幻ﹺ  阅读(9)  评论(0编辑  收藏  举报