MySQL 第七天(核心优化一)

一.Mysql核心优化

1. 优化的方面

① 存储层:数据表"存储引擎"选取、字段选取、逆范式(3范式)

② 设计层:索引、分区/分表

③ 架构层:分布式部署(主从模式/共享)

④ sql语句层:结果一样的情况下,要选择效率高、速度快、节省资源的sql语句执行

 

2. 存储引擎

熟悉的存储引擎:Myisam、innodb

 

什么是存储引擎:

数据表存储数据的一种格式

使用不同格式存储数据,不同格式的特性也是不一样的。例如innodb存储引擎的特性有:支持事务、支持行级锁、支持外键

 

MySQL中的数据是通过各种不同的技术(格式)存储在文件(或者内存)中的。技术和本身的特性就称为"存储引擎"。

 

现实生活中,楼房平房就是具体存储人的存储引擎,楼房、平房有自己独特的技术特性

例如楼房有楼梯、电梯、平房可以自己打井喝水等。

 

 

 

在进行项目开发的时候,要根据自己业务的特点,选择适合存储数据的存储引擎使用。

 

innodb存储引擎支持:事务、行级锁、外键

2.1 Myisam

① 结构、索引、数据文件

 

上图三个文件,支持物理复制、粘贴操作(就是数据的备份、还原)

 

 

给数据表添加记录信息:

 

此时student.MYD里边有填充数据:

 

② 数据存入的顺序

发现,数据的写入顺序 与 读出顺序保持一致。

 

启发:该Myisam数据表存入数据的时候,不给排序,按照写入的顺序进行存储。

这样做的好处,速度非常快。

 

③ 并发性

并发性稍低,多人同时做请求速度稍慢。

锁机制:每次都锁住整张数据表

④ 压缩机制

如果一个myisam数据表存储的数据非常多,就会占据很大的硬盘空间,为了优化处理,可以把这个myisam数据表给进行压缩处理。这样节省"硬盘空间"资源。

 

 

具体压缩步骤:

A. 压缩技术:myisampack.exe 表名

 

B. 重建索引

    根据压缩后的数据把索引重建建立起来。

    重建索引的工具:myisamchk.exe -rq 表名

 

C. 只读特性

压缩的数据表不能再写数据了,因此对数据表进行压缩的时候,一定需要考虑好

a.有的数据表适合压缩,数据不频繁发生变化的数据适合,例如全国的邮编信息、用户的收货地址信息。

b.有的不适合,数据频繁发生变化的就不适合压缩

 

如果必须要对压缩的数据表进行"写"操作,就"解压"

具体解压:myisamchk.exe --unpack 表名

(解压缩的同时,索引会自动重建)

 

 

 

 

 

 

2.2 innodb

① 结构、索引、数据文件

 

innodb存储引擎数据表,有单独的"结构文件"

① 默认情况下,所有数据库所有innodb数据表的 索引数据 文件都合并到一起

 

 

 

该集中的文件的数据如果遭到破坏,就不好恢复。最好给每个innodb数据表创建单独的
"数据/索引"文件。

一般该innodb数据表信息的备份、恢复要通过命令方式:

> mysqldump -uroot -p密码 数据库名字 > f:/20151214.sql [备份]

> mysql -uroot -p密码 数据库 < f:/20151214.sql [还原]

② 单独设置"数据/索引"文件

要为每个innodb数据单独设置其"数据/索引"文件

最后每个innodb数据表形成的两种格式文件:*.frm 数据/索引文件*.ibd

 

 

服务器重启之后,innodb_file_per_table的值要归位,不过不影响之前已经创建好的数据表结构。

 

 

③ 数据存入顺序

该innodb数据表,数据的写入顺序 与 存储的顺序不一致,需要按照主键的顺序把记录摆放到对应的位置上去,速度比Myisam的要稍慢

 

④ 并发性

并发性高,多人同时请求,速度快、效率高

锁机制:行锁,每次只锁住一条记录信息。

 

2.3 memory

内存存储引擎,

特点:内部数据运行速度非常快

缺点:服务器如果断电,就会清空该存储引擎的全部数据

 

字段选取

3.1 选取占据空间小的字段

int整型字段的选取

bigint int mediumint smallint tinyint

例如人的年龄适合使用tinyint类型

乌龟的年龄使用smallint类型

数据表主键id值在没有超过1600万的时候,就可以使用mediumint类型

int

 

3.2 内容长度固定字段

varchar(长度) 1--65535字节

内容范围:单字节内容(abc...2323..) 近65535个内容,内部要保留1-2个字节,保存内容的长度使用。

存储汉字(utf-8字符集 3个字节=一个汉字) 1--2万多汉字

char(长度) 1--255字符

单字节:每个字节等于1个字符

汉字:3个字节等于1个字符

无论单字节内容、汉字 都可以存储1-255个

 

char() 的运行速度快 ,例如char(20) 实际存储16个字符,分配20个空间

varchar()运行速度少慢 ,例如varchar(20) 实际存储16个字符,分配16个空间

 

内容最好固定住长度

手机号码存储:char(11)

存储邮箱:速度快char(40) 、 空间节省 varchar(40)

 

3.3 整型存储

时间变为整型存储:

int

date time datetime timestamp

 

集合:set('篮球','排球','足球','棒球')

枚举:enum('男','女','保密')

建议使用集合、枚举类型,他们底层内部使用的整型进行存储

 

ip地址也可以转换为整型存储。

mysql: inet_aton(ip) inet_ntoa(数字)

php: ip2long(ip) long2ip(数字)

 

总结:

  1. 存储引擎
  2. myisam
  3. innodb

     

    myisam: 写入数据非常快,适合使用场合dedecms/phpcms/discuz等写入、读取操作多的系统

    innodb: 适合业务逻辑比较强的系统,例如ecshop、crm、办公系统、商城系统

     

    4. 逆范式

    数据表的总体设计要遵守三范式,但是有的时候为了整体性能的考虑,就不遵守一点,这样就称为"逆范式"

     

    需求:查询每个分类下商品的数量

    goods商品表: id name cat_id(分类id)

    category分类表: cat_id cat_name

     

    select cat_id,count(g.id) from goods g left join category c on g.cat_id=c.cat_id group by g.cat_id

    以上sql语句可以按照需求获得对应的信息,但是涉及到两个表连表查询,这样查询速度不是很快,如果这样需求比较多,则会影响mysql的性能。

     

    现在做优化,把连表查询变为"单表查询"。

    数据表做修改设计:

    category分类表: cat_id cat_name number(当前分类下商品总数量)

    (这样后期商品每增加、减少的时候就需要特殊维护number字段内容)。

     

    这样相同需求的sql语句就可以如下执行:

    select cat_id,number from category;

     

    以上number字段的设计不符合三范式,其是一个"多余"的字段。

     

    4.1 三范式

    一范式:字段内容确保是原子性的,不能再分割

    student数据表

    字段:

    学生信息(字段)

    张三,25,北京

     

    姓名

    年龄

    地址

    张三

    25 

    北京

     

     

    二范式:每个字段与当前数据表的主键有关联

     

    三范式:每个字段与当前数据表的主键是直接关联(非间接)

     

    5. 索引

    主键索引(primary key)

    索引是进行数据库设计的时候,提升性能最有效的一个技术。

    5.1 什么是索引

    公交车站牌是索引

    办公楼指示牌是索引

    从技术本身的角度看索引,索引就是一种数据结构(寝室大楼),数据结构内部有算法,可以帮组我们快速、准确定位需要的信息。

     

    算法:获得一些信息的时候,这些信息都是有规律有规则(602房间)的在某个地方放着,我们可以掌握规律、规则并获得需要的数据。

    5.2 是否使用索引的差别

    准备一个操作的信息数据表:

    (Myisam表支持物理复制、粘贴的方式还原信息)

     

     

     

    5.3 索引为什么速度快

    索引是数据存储的一种机制,该机制里边可以简单理解有索引字段字段对应记录的物理地址

     

    索引字段按照一定的规律、规则组织在一起(内部有数据结构/算法),可以加快信息的查找,

    信息在索引内部被查找出来后,直接对应记录的"物理地址",根据物理地址就可以快速定位需要的记录信息。

     

     

    5.4 索引创建

    数据表的全部字段都可以创建索引

    索引类型:

    ① 主键索引

    ② 唯一索引(字段内容不能重复)

    ③ 普通索引

    ④ 全文索引(把一个文章的内容都给创建索引)

    (mysql5.6.4之前只有Myisam支持全文索引,之后 Myisam和Innodb都支持。)

    复合索引:多个字段组成索引

     

    索引名称问题:

    unique key [名称] (name),

    key [名称] (height),

    fulltext key [名称] (introduce)

        索引名称可以不设置,默认与当前索引字段名称一致。

     

     

  4. 创建数据表同时设置索引

     

    B. 给存在的数据表增加索引

    C.设置复合索引

    5.5 删除索引

    注意:删除主键索引,必须先去除auto_inrement属性

     

    5.6 执行计划explain

    执行计划:一条sql语句在没有执行之前,先把需要的资源都计划好,例如cpu、内存等资源的分配预计,该行为就称为"执行计划"

     

    我们就只研究一条sql语句是否使用到"索引"。

    ① 使用到索引,耗费资源少,查询速度快

    ② 没有使用到索引,耗费资源多,查询速度慢

    通俗说,只有关联到索引的sql语句,才是优化的sql语句

     

    目前,只有"查询sql"语句支持做执行计划。

     

     

    上图通过执行计划,可以看到有真实使用索引,因此执行速度会很快。

     

    5.7 索引适合场合

    注意:有的字段重复内容很多(例如性别字段),则不要设置索引,因为他不会起作用。

    ① where条件后边的字段都可以设置索引

    排序字段适合做索引

     

     

    ③ 索引覆盖

    做数据查询,查询的字段就是索引的内容

    这样索引本身就支持数据的提供,其已经不获得具体其他字段信息。

     

    数据查询只通过索引内容就获得需要的信息,就称为"索引覆盖"

     

    我们需要的信息(ename/deptno),单纯从索引内部就提供好了,其不会去记录中获取其他不相关的信息,因此索引本身就满足我们对数据的获取,这样的索引查询结合起来运行速度是最快的,也可以称为是"黄金索引"。

        

     

    ④ 连接查询

    select from 表1 join 表2 on 表1.字段=表2.字段

    上边sql语句的表1.字段 也称为"外键字段"

        外键字段也适合做索引。

    5.8 索引原则

    ① 字段独立原则

        select * from emp where empno=1345629; //字段独立,可以使用索引

        select * from emp where empno+2=1345629; //字段不独立(不能使用索引)

     

    ② 左原则

     

    注意:数字内容不要使用like(没有索引可用)

     

    模糊查询的时候,有可能用到索引,也有可能不能使用索引
    例如:

    select * from emp where ename like "%内容%";

    select * from emp where ename like "tom_"; //tomatomb、tomtt

    %符号:代表对应位置出现1或多个其他内容

    _符号:代表对应位置出现1个其他内容

     

    模糊查询左边内容固定的时候可以用到索引,否则不能使用

    select * from emp where ename like "内容%"; //能用索引

    select * from emp where ename like "%内容%"; //不能用索引

    select * from emp where ename like "内容__"; //能用索引

    select * from emp where ename like "_内容__"; //不能用索引

     

     

    ③ 复合索引

     

     

    复合索引的第一个字段,单独作为条件可以使用到该索引。

    复合索引的第二个字段,单独作为条件不可以使用到该索引

    复合索引的两个字段都作为条件,则可以使用该索引

     

    ④ or原则

    两边都有索引,则会全部都分别使用:

     

    一个有索引,另一个没有索引(与顺序无关),导致结果一个索引都没有被使用:

     

    总结:

  5. 逆范式

        不要太遵守三范式,称为"逆范式"

        在分类表中记录对应商品的数目,方便后期查询

     

        三范式:

        1范式:字段设计原子型,不能分割

        2范式:字段与主键id关联

        3范式:字段与主键id直接关联

  6. 索引

        索引就是数据结构,数据结构里边有算法

        创建索引:创建表同时设置、后期给已经存在数据表设置

        删除索引:

            删除主键索引,先取出主键的auto_increment属性

            alter table 表名 drop primary key;

            alter table 表名 drop key 索引名称;

        

        执行计划:explain

            分析sql语句是否使用到索引

            只针对select查询语句起作用

     

        索引使用场合:

        ① where后边字段

        ② order by 排序

        ③ 索引覆盖

        ④ 连表查询 (外键设置索引)

     

        索引原则

        ① 字段独立

        ② 左原则(模糊查询时)

        ③ 复合索引

        ④ or原则

     

    作业:

  7. 练习索引的创建和删除
  8. Mysiam和innodb数据的不同特性分析出来

     

     

     

     

posted @ 2016-11-18 16:53  runningto  阅读(362)  评论(0编辑  收藏  举报