MySQL学习笔记(五)

倒数第二天!冲冲冲!!!

一、索引

一个表里面可以有多个索引。

1. 索引的作用:约束与加速查找

  无索引:从前到后依次查找

  有索引:会为索引列创造一个额外文件(以某种格式存储)。在使用索引进行查找时,会优先在该文件里面进行查找,所以查询时很快。——因此也会占据硬盘的空间。

  不足:索引查询快,但是对索引进行更新和删除时慢。

  命中索引:对索引的正确引用才能加速查找。 select * from student where sid = 1 

2. 索引类型

  某种格式——   

  hash索引:索引表。在索引表中将数据以“哈希值”进行存储,同时保存该数据存储地址。需要注意的是,在索引表中,哈希值的排列顺序与原来表中的数据顺序是不一样的。

  缺点:因此在hash表中如果查找where id > 3 之类的数据,即使id列为索引列,其查找速度在大数据的情况下也会变慢,因为hash中的排列时无序的,不能一顺溜的取出来。简而言之,查找连续的数值很慢。

  优点:查找单值速度非常快。

  btree索引(常用):将值转化为数字,以二叉树的形式进行存储(按顺序存储)。——(在innodb中使用的是btree)

  a. 普通索引:加速查找(没有唯一性的限制)

   创建索引: create index ix_name on tiny_data<email> (ix_name为索引名称)

   删除索引: drop index ix_name on tiny_data 

   查看索引: show index from tiny_data; 

   在创建表时创建索引:

create table in1(
    nid int not null auto_increment primary key,
    name varchar(32) not null,
    email varchar(64) not null,
    extra text,
    index ix_name (name)
)
创建表+索引

      对于创建索引时如果是BLOB 和 TEXT 类型,必须指定length: create index ix_extra on in1(extra(32)) 

  b. 主键索引:加速查找+不能为空+不能重复 (就是创建时的primary key)

   在建表之后创建主键索引:  alter table 表名 add primary key(列名)  

  c. 唯一索引:加速查找+不能重复(可以为空)

   创建索引: create unique index 自定义索引名称 on 表名(列名) (就是多加个unique)

      删除索引: drop 自定义索引名 on 表名 

      在创建表同时创建索引:(注意此时关键词是 unique 不是 unique index)

create table in1(
    nid int not null auto_increment primary key,
    name varchar(32) not null,
    email varchar(64) not null,
    extra text,
    unique ix_name (name)
)
创建表+索引

  d. 组合索引(多列组合成一个索引):联合普通索引,联合主键索引,联合唯一索引

   创建索引:  create unique index 自定义索引名称 on 表名(列名,列名)  

      删除索引:  drop 自定义索引名 on 表名  

      最左前缀匹配:假设 设立sid 与 sname 都是 student 表的索引。 create index ix_sid_sname on student(sid, name) 

select * from student where sid = 1;                         -- 可以在索引文件中执行,使用索引
select * from student where sid = 1 and sname = "alex";      -- 可以在索引文件中执行
select * from student where sname = "alex";                  -- 不可以在索引文件中执行

3. 索引补充

(1)覆盖索引:(名词解释)在索引文件中可以直接获取数据(指索引值)。如  select sid from student where sid = 1  (在sid为student表的索引的情况下)。

(2)索引合并:(名词解释)把多个单列索引合并使用。如  select sid, sname from student where sid = 1 and sname = 'alex  (在sid与sname都是索引的情况下)。不过虽然“索引合并”使用起来比“联合索引”方便,但是“联合索引”效率更高。

二、命中索引(重点***)

索引内容参考——武沛齐博客

1. 正确使用索引

(1)避免使用“%like%”语句进行查询,因为速度非常慢。

    解决办法:使用第三方工具,搜集分词结果并存储该分词所在ID(索引),在查询时程序会优先在第三方工具的分析结果中进行查询,获取ID后再使用索引查询。

(2)避免使用函数

(3)or:查询条件是(索引列 or 非索引列)的组合时,会导致索引失效。

(4)类型不一致:如果列是字符串类型,传入条件时必须用引号引起来,否则会执行一个类型转换过程,使查询速度变慢。

(5)普通索引使用“!=”进行查询时,无法命中索引,即没有使用索引查询。Especially, 主键除外,如果是对主键使用“!=”进行查询,还是会使用索引进行查询。

    普通索引使用“>”进行查询时,无法命中索引,即没有使用索引查询。Especially, 如果是主键或索引是整数类型,则还是会走索引。

    “order by” 当根据索引排序时候,选择的映射如果不是索引,则不走索引。如 select email from tb1 order by name desc; 。Especially, 如果对主键排序,则还是走索引。

2. 其他注意事项(1,2,3,9最基础)

(1)避免使用select *

(2)count(1)或count(列)代替count(*)

(3)创建表时尽量时 char 代替 varchar

(4)表的字段顺序固定长度的字段优先

(5)组合索引代替多个单列索引(经常使用多个条件查询时)

(6)尽量使用短索引。可以创建局部索引

create index ix_name on tb1(title(16))
-- 表示用title的前16个字符做索引

(7)使用连接(JOIN)来代替子查询(Sub-Queries)——不过这个在MySQL中是一样的,在SQLServer中有差别

(8)连表时注意条件类型需一致

(9)引散列值(重复少)不适合建索引,例:性别

三、MySQL执行计划

执行计划:让MySQL预估执行操作需要的时间。

#输入,假设索引是(id, email)
explain select * from tiny_data; --没有走索引(all)
explain select * from tiny_data where id = 3; -- 主键索引(const)
explain select * from tiny_data where email = "alex@qq.com"; -- 普通索引(ref)

预估时间判断——查看type(仅供参考)

type:all(全表扫描)——没有走索引,速度很慢

     const(走了主键索引)——速度很快

     ref(走了索引)——速度很快

 查询时的访问方式,性能:all < index < range < index_merge < ref_or_null < ref < eq_ref < system/const

四、DBA工作

1. 慢日志:在服务端进行设置

    a.执行时间过慢,如大于10秒

    b.未命中索引

    将以上记录记录到指定的日志文件路径。

2. 配置

  (1)基于内存

  查看当前配置信息: show variables like '%query%' 

  在配置信息的结果中重点关注:

slow_query_log = OFF                              -- 是否开启慢日志记录
long_query_time = 2                               -- 时间限制,超过此时间,则记录
slow_query_log_file = /usr/slow.log               -- 日志文件路径
log_queries_not_using_indexes = OFF               -- 为使用索引的搜索是否记录

  修改当前配置: set global 变量名 = 

  (2)基于配置文件

  a. 自建配置文件:在启动服务端的时候设置配置文件路径,mysql慢日志就会使用配置文件中的配置

   mysqld --defaults-file='D:\my.conf' 

  b. 在已有的自带的配置文件下进行更改(my-default.ini)。(我没有找到这个文件,,,)

  ps:修改配置文件后,需要重启服务。(在修改前记得备份,如果修改后出了问题,可以还原)

五、MySQL分页性能相关方案(重点***)

limit分页时,如(limit 30,10),是先扫描40条数据,再取最后十条,所以越往后,需要扫描的数据量越大,会越慢。

解决方案:

1. 设定允许查询的页数

2. a.从索引表中进行扫描,实行覆盖索引 b. 从覆盖索引中查找 (下面这个mysql用不了)

select * from tiny_data where id in (           -- 利用索引进行查找
    select id from tiny_info limit 20000, 10    -- 覆盖索引
)

3. 最优方案(单纯基于数据库的最优操作):

  记录当前页的最大与最小id(假设每页记录条数为10)

  (1)上一页/下一页

#min_id, max_id
-- 下一页
SELECT * FROM userinfo3 WHERE id > max_id limit 10
-- 上一页
SELECT * FROM userinfo3 WHERE id < min_id ORDER BY id desc limit 10

  (2)跳转型:上一页 192 193 194 【195】 196 197 198 下一页

SELECT * FROM userinfo3 WHERE id in (
(SELECT * FROM userinfo3 WHERE id > max_id limit 30) as N ORDER BY N.id DESC LIMIT 10
)
-- 这么讲了一通,理解了大致操作,但是没有实操
posted @ 2021-02-23 14:52  不知天高地厚的小可爱  阅读(59)  评论(0编辑  收藏  举报
1