MySQL笔记汇总

1 MySQL背景介绍
- 1.1 关于MySQL
- 1.2 MySQL8.0新特性
2 CentOS 7.6 安装MySQL
- 2.1 环境准备
- 2.2 配置MySQL远程连接
3 MySQL基础知识储备
4 开发规范
5 B+树索引
6，SQL优化
7 事务和锁

1 MySQL背景介绍

1.1 关于MySQL

官方文档：https://dev.mysql.com/doc/refman/8.0/en/

MySQL是Oracle公司开发、发布和支持的最流行的开源SQL数据库管理系统。

【主要特点】

开源
使用BTree索引
支持多线程，对多核CPU性能可以达到更好的发挥
用C和C++编写

1.2 MySQL8.0新特性

数据字典

详情参考：https://cloud.tencent.com/developer/article/1123363

数据字典存放MySQL元信息：表结构、数据库名或表名、字段的数据类型、视图、索引、表字段信息、存储过程、触发器等。

新版本改进：
- 将所有原先存放于数据字典文件中的信息，全部存放到数据库系统表中（文件-->表）【提升查询数据速度】
- 对INFORMATION_SCHEM，mysql，sys系统库中的存储引擎做了改进，原先使用MyISAM存储引擎的数据字典表都改为使用InnoDB存储引擎存放。
更换新的身份认证插件caching_sha2_password【默认使用】，但由于与客户端兼容性不太好，大多数使用者回退到了mysql_native_password版本
Innodb增强：
- 自增列【消除了以往重启实例自增列不连续的问题】
- 可禁用死锁检测
  
  一个新的动态变量，innodb_deadlock_detect，可用于禁用死锁检测。在高并发性系统上，当多个线程等待同一锁时，死锁检测会导致减速。有时，禁用死锁检测并依赖于innodb_lock_wait_timeout在发生死锁时设置事务回滚。

2 CentOS 7.6 安装MySQL

2.1 环境准备

首先centos7 已经不支持mysql（大概是因为收费），所以内部集成了mariadb，而安装mysql的话会和mariadb的文件冲突，所以需要先卸载掉mariadb

卸载mariadb

rpm -qa | grep mariadb

rpm -e --nodeps mariadb-libs-5.5.60-1.el7_5.x86_64

centos7 内部集成了mariadb，而安装mysql的话会和mariadb的文件冲突，所以需要先卸载掉mariadb。

【如果之前安装了mysql需要先卸载】

yum remove mysql*

删除安装目录

whereis  mysql

rm -rf /usr/share/mysql

安装MySQL

获取yum源（MySQL官网）

安装yum源

rpm -Uvh https://dev.mysql.com/get/mysql80-community-release-el7-3.noarch.rpm

查看各版本启动状况
```
yum repolist all | grep mysql
```
默认开启最新版8.0
[调整命令】禁用8.0，开启5.7
```
yum-config-manager --disable mysql80-community
yum-config-manager --enable mysql57-community
```
命令在yum-utils 包里，安装既可以解决无法找到yum-config-manager命令：
```
yum -y install yum-utils
```
安装mysqll
```
yum -y install mysql-community-server
```

2.2 配置MySQL远程连接

查看mysql版本
```
mysql -V
```

启动mysql&&设置开机自启

systemctl start mysqld
systemctl enable mysqld

查看默认生成密码

grep 'temporary password' /var/log/mysqld.log

登录修改密码
```
mysql -uroot -p
```

修改密码

ALTER USER 'root'@'localhost' IDENTIFIED BY 'NoPassword564925080!';

mysql5.7之后默认安装了密码安全检查插件（validate_password），默认密码检查策略要求密码必须包含：大小写字母、数字和特殊符号，并且长度不能少于8位。否则会提示ERROR 1819 (HY000): Your password does not satisfy the current policy requirements错误.

授权远程登录用户

默认的密码加密方式是：caching_sha2_password，而现在很多客户端工具还不支持这种加密认证方式，连接测试的时候就会报错：client does not support authentication protocol requested by server; consider upgrading MySQL client
```
CREATE USER 'noneplus'@'%' IDENTIFIED BY 'Noneplus564925080!';

GRANT ALL ON *.* TO 'noneplus'@'%';

//修改认证方式为mysql_native_password
ALTER USER 'noneplus'@'%' IDENTIFIED WITH mysql_native_password BY 'Noneplus564925080!';

flush privileges;
```
开放服务器3306端口
远程连接

3 MySQL基础知识储备

3.1 常用命令

数据库相关命令

show databases;

create database database_name;

use database_name;

drop database_name;

数据库表相关命令

【数据库和数据库表相关命令都属于DDL数据定义语言】

show tables;     [先切换到指定数据库]

//创建表
CREATE TABLE `user_info` (
  `id` int(10) NOT NULL AUTO_INCREMENT COMMENT '用户id',
  `username` varchar(10) DEFAULT NULL COMMENT '用户姓名',
  `password` varchar(20) DEFAULT NULL COMMENT '用户密码',
  `age` int(5) DEFAULT NULL COMMENT '年龄',
  `email` varchar(20) DEFAULT NULL COMMENT '邮箱',
  PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=100 DEFAULT CHARSET=utf8 COMMENT='用户信息表'


//查看表定义
show create table user_info \G;

drop table user_info;

//删除表字段
alter table user_info column age;

//修改表
Alter table user_info modify username varchar(15);

//增加表的字段
alter  table user_info add column gender int(1);

//字段改名
alter table user_info change age age1 int(3);

//modify,add,change都可以进行排序

Alter table user_info modify username varchar(15) first;  //放在最前面

alter  table user_info add column gender int(1) after age;//字段至于age之后

//修改表名

alter table user_info rename person_info;

增删改查命令

【增删改查属于DML数据操作语言】

插入

INSERT INTO user_info(username,password,age,email) VALUES('hq','123456789',22,'glaring@sina.com')

更新

UPDATE user_info SET username='hq',age=23,email='56492508@qq.comm' WHERE id=5

删除

DELETE FROM user_info WHERE id=6

查询

SELECT * FROM user_info WHERE id = 6

SELECT * FROM user_info WHERE id = 6 and age<30

排序【默认升序】

SELECT * FROM user_info ORDER BY ID DESC LIMIT 10   //查询最后十条数据

SELECT * FROM user_info ORDER BY ID DESC LIMIT 10,20   //查询最后20条数据的前10条

统计数据总条数

SELECT COUNT(1) FROM user_info;

统计最大值，最小值，求和

SELECT MAX(age),MIN(age) ,SUM(age) FROM user_info;

表连接查询

select ename,deptname from emp,dept where emp.deptno=dept.deptno;

3.2 常用数据类型

数值类型

整数类型	字节	最小值	最大值
tinyint	1	有符号-128 无符号0	有符号127 无符号255
smallint	2	有符号-32768 无符号0	有符号32767 无符号65535
mediumint	3	有符号-800w 无符号0	有符号800w 无符号167w
int，integer	4	有符号-21亿无符号0	有符号21亿无符号42亿
bigint	8	有符号-92w兆无符号0	有符号92w兆无符号184w兆

int（5）指定显式宽度【不显式指定默认int（11）】，当数值宽度小于五位的时候，默认填满。zerofill指用0填充。

unsigned表示是否带符号

浮点数类型	字节	最小值	最大值
float	4
double	8

定点数类型	字节	最小值	最大值
decimal（M，D）	M+2	有符号-128 无符号0	有符号127 无符号255

表示一共显示M位数字，包括整数位和小数位，其中D位代表小数点有几位

decimal不指定精度默认整数位为10，小数位为0.

日期时间类型

类型	字节	最小值	最大值
date	4	1000-01-01	9999-12-31
datetime	8	1000-01-01 00:00:00	9999-12-31 23:59:59
timestamp	4	1970010108001	2038年的某个时刻

记录系统当前时间可用timestamp，支持不同地方的时区差异

TIMESTAMP 存储的时间范围 1970-01-01 00:00:01 ~ 2038-01-19-03:14:07

字符串类型

类型	描述
char	0-255字节
varchar	0-65535字节
tinyblob	0-255字节
blob	0-65535字节
mediumblob	0-16772150字节
longblob	0-4294967295字节
tinytext	0-255字节
text	0-65535字节
mediumtext	0-16772150字节
longtext	0-4294967295字节
varbinary（M）	0-M字节
binary（M）	0-M字节

3.3 运算符

算术运算符

算术运算符	说明
+	加法运算
-	减法运算
*	乘法运算
/	除法运算，返回商
%	求余运算，返回余数

比较运算符

比较运算符	说明
=	等于
<	小于
<=	小于等于
>	大于
>=	大于等于
<=>	安全的等于，不会返回 UNKNOWN
<> 或!=	不等于
IS NULL 或 ISNULL	判断一个值是否为 NULL
IS NOT NULL	判断一个值是否不为 NULL
LEAST	当有两个或多个参数时，返回最小值
GREATEST	当有两个或多个参数时，返回最大值
BETWEEN AND	判断一个值是否落在两个值之间
IN	判断一个值是IN列表中的任意一个值
NOT IN	判断一个值不是IN列表中的任意一个值
LIKE	通配符匹配
REGEXP	正则表达式匹配

逻辑运算符

逻辑运算符	说明
NOT 或者 !	逻辑非
AND 或者 &&	逻辑与
OR 或者 \|\|	逻辑或
XOR	逻辑异或【相同为0，不同为1】

位运算符

位运算符	说明
\|	按位或
&	按位与
^	按位异或
<<	按位左移
>>	按位右移
~	按位取反，反转所有比特

运算符优先级

优先级由低到高排列	运算符
1	=(赋值运算）、:=
2	II、OR
3	XOR
4	&&、AND
5	NOT
6	BETWEEN、CASE、WHEN、THEN、ELSE
7	=(比较运算）、<=>、>=、>、<=、<、<>、!=、 IS、LIKE、REGEXP、IN
8	\|
9	&
10	<<、>>
11	-(减号）、+
12	*、/、%
13	^
14	-(负号）、〜（位反转）
15	!

4 开发规范

4.1 设计规范

范式

第一范式：无重复的列
第二范式：属性完全依赖于主键
第三范式：属性不能传递依赖其他非主属性

范式的作用是避免数据冗余（数据重复）。

范式的问题

按照范式设计出来的表在数据冗余的问题虽然得到解决，但是会生成许多表，导致了表数量的复杂性，其二，查询数据的时候，多表查询的时间远远高于单表查询的时间。

反范式

范式的目的是减小数据冗余，而反范式指的是在一定程度上允许数据冗余，目的是加快数据操作。

对比

范式与反范式是一场时间和空间的较量，满足范式节省空间，满足反范式加快操作速度。

在满足范式设计数据库的前提条件下，再根据具体的业务需求完成反范式的设计。

4.2 命名规范

小写+下划线，不能使用保留关键字【！！！】

【MySQL对象名默认规定大小写敏感，且在生产环境中MySQL通常运行在Linux系统下，Linux系统本身也是大小写敏感的。】

【https://dev.mysql.com/doc/mysqld-version-reference/en/keywords-8-0.html建议在设计数据表之后逐一排查有没有使用关键字。】

4.3 字段规范

原则：

尽可能选择存储空间最小的字段【栗子：IP转化为整型存储】、
非负型数据优先使用无符号存储

1，char VS varchar

char 定长浪费空间查询速度快

varchar 变长节省空间查询速度较慢

出于存储空间的考虑，优先选择varchar

2，避免使用text，blob，如果一定要使用，单独出扩展表（通常这类数据会考虑使用NoSQL来存储）

【MySQL内存临时表不支持text，blob这样的大数据类型，只能使用磁盘临时表完成，并且会导致二次查询】

3，同财务相关的最好使用定点数decimal

4，日期类型选择

DATETIME：记录年月日时分秒，表示的时间范围最大
如果记录的日期要让不同时区的人使用，使用TIMESTAMP

5 B+树索引

5.1 什么是索引？

索引是一种数据结构，具体表现在查找算法上。

5.2 索引目的

提高查询效率

【类比字典和借书】

如果要查“mysql”这个单词，我们肯定需要定位到m字母，然后从下往下找到y字母，再找到剩下的sql。如果没有索引，那么你可能需要把所有单词看一遍才能找到你想要的。

去图书馆借书也是一样，如果你要借某一本书，一定是先找到对应的分类科目，再找到对应的编号，这是生活中活生生的例子，通用索引，可以加快查询速度，快速定位。

5.3 B树

结构特征：每个节点可包含多个子节点，叶子节点位于同一层（每个节点保存索引和数据）

使用用法：B树为磁盘预读设计，其特征相对于二叉树降低了高度，减少IO次数（树的高度等于IO次数）

1569143287075

5.3 B+树

结构特征：只在叶子节点存储数据，且叶子节点有序排列，通过链指针相连（只有叶子节点保存数据，其他节点都只保存索引，单次IO能加载更多节点）

使用用法：B树解决了磁盘IO问题，而B+树通过数据结构优化和区间访问加快了元素的查找效率

1569143297523

5.4 原理分析

索引存储位置

索引本身也很大，所以存储在磁盘中,需要加载到内存中执行。

故：索引结构优劣标准：磁盘I/O次数

局部性原理和磁盘预读

局部性原理：当一个数据被用到，其附近的数据很可能会马上用到

磁盘预读：由于存储介质的特性，磁盘本身存取就比主存慢很多，再加上机械运动耗费，磁盘的存取速度往往是主存的几百分分之一，因此为了提高效率，要尽量减少磁盘I/O。为了达到这个目的，磁盘往往不是严格按需读取，而是每次都会预读，即使只需要一个字节，磁盘也会从这个位置开始，顺序向后读取一定长度的数据放入主存。

B树如何利用磁盘预读功能

B树的节点大小和磁盘的IO大小是进行过匹配的，一次IO可以读取一整个节点的大小。这样就能有效减少IO次数。

【如果节点大小和B树大小不对齐，那么同一页节点可能需要两次IO读取】

综上所述，B树解决的核心问题是IO次数的问题

为什么B+树比B树更适合作为索引结构

B树解决了磁盘IO的问题但没有解决元素遍历复杂的问题。

B+树的叶子节点用链指针相连，极大提高区间访问速度。【比如查询50到100的记录，查出50后，顺着指针遍历即可】

B+树的叶子结点可以存哪些东西

可能是整行数据，也可能是主键的值。

前者被称为聚簇索引，后者称为非聚簇索引。

聚簇索引更快！！！

为什么？？？聚簇索引已经查到整行数据了，而非聚簇索引还可能根据主键值再进行查询一次。

例外：覆盖索引——数据直接从索引中取得。

6，SQL优化

SQL优化背景

开发项目上线初期，由于业务数据量相对较少，一些SQL的执行效率对程序运行效率的影响不太明显，而开发和运维人员也无法判断SQL对程序的运行效率有多大，故很少针对SQL进行专门的优化，而随着时间的积累，业务数据量的增多，SQL的执行效率对程序的运行效率的影响逐渐增大，此时对SQL的优化就很有必要。

SQL优化发生在业务量达到一定规模的时候

目的是优化SQL的执行效率

6.1 优化范围

硬件资源
操作系统参数，数据库参数配置
SQL语句，索引优化

6.2 SQL优化

数据库设计优化【规范，前期设计】
SQL语句优化
索引优化
读写分离，分库分表

6.3 慢查询语句

慢查询：10s无返回结果，定义为慢查询

SHOW STATUS LIKE "slow_queries";

SHOW VARIABLES LIKE "long_query_time";//可以显示当前慢查询时间

set long_query_time=1 ;//可以修改慢查询时间

6.4 常用优化方法

避免全表扫描（考虑在 where 及 order by 涉及的列上建立索引）

尽量避免在 where 子句中对字段进行 null 值判断，否则将导致引擎放弃使用索引而进行全表扫描

select id from t where num is null    
可以在num上设置默认值0，确保表中num列没有null值，然后这样查询：    
select id from t where num=0

应尽量避免在 where 子句中使用!=或<>操作符，否则将引擎放弃使用索引而进行全表扫描

应尽量避免在 where 子句中使用 or 来连接条件，否则将导致引擎放弃使用索引而进行全表扫描

select id from t where num=10 or num=20    
可以这样查询：    
select id from t where num=10    
union all    
select id from t where num=20

in 和 not in 也要慎用，否则会导致全表扫描

select id from t where num in(1,2,3)    
对于连续的数值，能用 between 就不要用 in 了：    
select id from t where num between 1 and 3

应尽量避免在 where 子句中对字段进行表达式操作，这将导致引擎放弃使用索引而进行全表扫描
```
select id from t where num/2=100    
应改为:    
select id from t where num=100*2    
```

应尽量避免在where子句中对字段进行函数操作，这将导致引擎放弃使用索引而进行全表扫描

select id from t where substring(name,1,3)='abc'--name以abc开头的id    
应改为:    
select id from t where name like 'abc%'

很多时候用 exists 代替 in 是一个好的选择

select num from a where num in(select num from b)    
用下面的语句替换：    
select num from a where exists(select 1 from b where num=a.num)

索引并不是越多越好，索引固然可以提高相应的 select 的效率，但同时也降低了 insert 及 update 的效率(5)
尽量使用数字型字段，若只含数值信息的字段尽量不要设计为字符型，这会降低查询和连接的性能，并会增加存储开销
尽可能的使用 varchar 代替 char ，因为首先变长字段存储空间小，可以节省存储空间
任何地方都不要使用 select * from t ，用具体的字段列表代替“*”，不要返回用不到的任何字段
尽量避免使用游标，因为游标的效率较差，如果游标操作的数据超过1万行，那么就应该考虑改写

7 事务和锁

7.1 事务

7.1.1 事务存在的原因

事务存在的目的：保证用户对数据操作对数据是安全的。（比如说银行卡余额）

7.1.2 事务的特性——ACID

原子性：一个事务要么全部执行，要么不执行

一致性：事务开始和结束时，数据保持一致

隔离性：事务之间互不影响

持久性：事务操作的结果具有持久性

7.1.3 关于脏读，不可重复读，幻读

脏读

事务A读取了事务B中尚未提交的数据。如果事务B回滚，则A读取使用了错误的数据。

【一个事物在读的时候，禁止读取未提交的事务】
不可重复读

不可重复读是指在一个事务范围内多次查询却返回了不同的数据值，这是由于存在查询间隔，被另一个事务修改并提交了。

【一个事物在读的时候，禁止任何事务写】
幻读

在事务A多次读取过程中，事务B对数据进行了新增操作，导致事务A多次读取的数据不一致。

【一个事物加上表级锁，禁止任何操作的并发】

小结：

脏读是读取了尚未提交的数据，不可重复读是读取了不停更新的数据（修改），幻读是指读取了不停更新的数据（新增）。

7.1.4 关于事务隔离级别

目的：避免脏读，不可重复读，幻读

读未提交：一个事务可以读到另一个事务尚未提交的数据。也就是脏读，避免脏读的方式：

读提交：一个事务要等另一个事务提交后才能读取数据。但会导致一个事务中相同查询出现不同的结果。也就是不可重复读。避免不可重复读的方式：

重复读（RR，MySQL默认级别）：就是在开始读取数据时，不允许修改操作。但会导致由于允许insert操作导致的事务结果出现不同。也就是幻读，避免幻读的方式：：

序列化：序列化使事务串行顺序执行，但会大大降低并发性能。

7.2 锁机制

7.2.1 并发控制控制的是什么？

并发问题：某个时间点两次或两次以上同一请求的结果不一致。

当程序的使用者超过两个人时，就有几率产生并发问题。当程序的使用者变多，产生并发问题的概率就会随之上升。

总的来说，并发控制就是控制数据的一致性。

7.2.2 共享锁和排他锁

Innodb实现了两种类型的行锁：共享锁，排他锁。

共享锁：所有用户都可读取当前记录，但不可修改当前记录

select * from table lock in share mode

排它锁（悲观锁）：当前用户可进行增删改查，其他用户无法进行任何操作（MySQL的增删改操作默认加了排他锁，查无任何锁）

【为什么在Innodb中使用索引？】

Innodb行锁并不是锁记录而是锁索引，优先锁主键索引，其次锁非主键索引（比如唯一索引），如果没有索引，就需要通过全表扫描来找到当前记录，就相当于表锁了。（这也是为什么需要进行索引优化的原因）

意向共享锁和意向排他锁

Innodb虽然使用行锁，但并没有废弃表锁。

【行锁和表锁】

MyISAM存储引擎使用的是表锁，而Innodb增加了行锁。并不意味着Innodb彻底抛弃了表锁。

关于行锁，较小的粒度导致其高并发，但也因较小的粒度导致加锁慢，开销大，会出现死锁情况。

关于表锁，较大的粒度在高并发上的表现很弱，但同时粒度较大，加锁块，开销小，不会出现死锁情况。

没有完美的技术，只有合适的解决方案。在高并发场景下使用行锁而忍受一些问题本质上是一种权衡。

【意向锁的背景冲突】

意向锁的出现本质上是解决行锁和表锁矛盾的问题。

事务A获得了表中某一行的共享锁，事务B申请了表的写权限，这时候就会产生矛盾。

【关于意向锁】

首先，意向锁是一种表锁。

意向共享锁：事务获得表中的某一行的共享锁前，需要先获得整张表的意向共享锁。

意向排他锁：事务获得表中的某一行的排他锁前，需要先获得整张表的意向排他锁。

意向锁的加锁过程是自动完成的。

【意向锁的共享问题】

意向锁是表锁，它的互斥性是针对表级别的事务，比如一个事务要获取一张表的写权限。所以意向锁对于表级别的事务是互斥的。但是对于行级别的事务是共享的，也就是说，一个意向锁可以被多个行级别的事务所持有。

7.3 死锁

关于死锁抖音上有一个非常好玩的小视频：

面试官问：解释一下死锁，解释明白了就发offer

应聘者答：先发offer，发了offer再解释

死锁本质上就是持有锁和释放锁的问题，就像这个视频里描述的，面试官在听到死锁的解释后，才会释放offer这个锁，而应聘者是得到offer后才会释放死锁解释这个锁。offer和对死锁的解释就可以类比两个锁。

死锁的状态就是互相等待。

7.4 乐观锁与悲观锁

乐观锁和悲观锁并不是锁的具体实现，而是并发控制的两种策略，或者说是抽象。

乐观锁（适合多读场景）

乐观锁本质上是没有锁的。
执行流程，先读取数据，然后在更新前检查在读取至更新这段时间数据是否被修改
- 未修改：直接更新数据
- 已修改：重新读取，再次提交更新（或者放弃操作）

为什么乐观锁适合多读场景？

乐观锁是一种更新前的检查机制，相对于悲观锁来说在多读场景下可以减少锁的性能开销，对于多写场景，乐观锁会一直进入已修改，重新读取，再次提交的循环，反而带来更多的资源消耗。

悲观锁（适合多写场景）

读取数据的时候上锁（其他用户就无法读取），直到本次数据更新完成才会释放锁。在多写场景下，能保证较高的数据一致性。

【总的来说，乐观锁回滚重试，悲观锁阻塞事务】

posted @ 2020-08-11 16:06 笑谈渴饮匈奴血阅读(261) 评论(0) 编辑收藏举报

刷新页面返回顶部

笑谈渴饮匈奴血

仰天长啸