mysql-索引

索引

什么是索引

​ 可以理解为:搜索引导,索引是一个特殊的数据结构,其存储的数据的关键信息与详细信息的位置对应关系

​ 索引的原理:本质上就是尽可能的减小搜索范围

为什么需要索引

​ 加速查询,当数据量非常大的时候,查询一个数据是非常慢的

创建索引的语法

# 创建索引
create index 索引名称 on 表名称(字段名);

# 删除索引
drop index 索引名称 on 表名称;

# 联合索引
create index 索引的名字 on 表名称(字段名,字段名)

索引的影响

  1. 并不是有索引就一定能加速,需要确实查询语句是否有正确使用索引
  2. 索引页需要占用额外的数据空间
  3. 添加索引后,将导致增删改变慢(写入)

什么样的数据应该添加索引?

​ 查询操作较多,写入较少且数据量很大时

查询与写入操作的占比,10:1或者查询更多

磁盘IO

平均 查找一个数据需要时间为9ms, 这段时间CPU就会切换到其他的程序

而我们要加速查询,就必须减少IO操作的次数

索引数据结构

b+树

在b+树种叶子节点才是存储真实的数据的地方,叶子数据量越多,树的层级越高(层级树增加),导致IO次数增加

要避免这个问题,在叶子节点中尽肯能的存储更多的数据,-->应该将数据量小的字段作为索引.

默认最少得层级是三层

数据库结构图-b+树

最左匹配原则

当b+数的数据项是复合的数据结构,比如(name,age,sex)的时候(多字段联合索引),b+树会按照从左到右的顺序来建立搜索树,比如当输入的值为('张三',20,F)时,b+树会优先比较name来确定下一步的所搜方向,如果name相同再依次比较age和sex,最后得到索引的数据; 但当(20,F)这样的没有name的数据来的时候,b+树就不知道下一步改查哪个节点,因为建立搜索树的时候name就是第一个比较因子,必须要先根据name来搜索才能知道下一步去哪里查询;比如当(张三,F)这样的数据来检索时,b+树可以用name来指定搜索方向,但下一个字段age的缺失,所以只能把名字等于张三的数据都找到,然后再匹配性别是F的数据了,这个是非常重要的性质,即索引的最左匹配特性.

聚集索引

​ 聚集索引中包含了所有字段的值,如果拟定了主键,主键就是聚集索引,如果没有主键,则会找到一个非空+唯一的字段作为聚集索引,如果也找不着,自动生成一个字段作为聚集索引.

辅助索引

​ 除了聚集索引以外的都叫辅助索引

​ 辅助索引中只包含当前的索引字段和主键的值

覆盖查询

​ 指的是: 在当前索引结构中就能找到所有需要的数据,如果使用得是聚集索引,那一定是覆盖查询,如果辅助索引第一次在索引就直接获取到需要的数据,也是覆盖查询.

回表查询

​ 指的是在当前索引结构中找不到所需的数据,需要通过id,去聚集索引中查询,速度慢与聚集索引.

结论:

  1. 使用占用空间最小的字段来作为索引

  2. 不要在一行中存储太多的数据,例如:小说,视频,如果字段太多可以分表

  3. 尽量使用覆盖查询

  4. 如果字段区分度地(重复度高),建立索引是没有意义,反过来说应该讲区分度高的字段作为索引

  5. 模糊匹配中,百分号尽量不要写在前面

  6. 不要再等号左边做运算,即不要再查询的字段做运算.

    例如:select count(*) from usr where id * 3 =6; 这种也会遍历所有记录

  7. and 语句中会自动找一个具备索引的字段优先执行,所以我们应该在and语句中至少包含一个具备索引的字段

  8. or 语句要避免使用, 因为需要所有字段都有索引才能加速

  9. 联合索引中,顺序应该将区分度最高的放到左边,最低的放右边

    查询语句中必须保证最左边的索引出现在语句中

    另外需要注意:如果要查询的数据量非常大,索引无法加速

总结:不是添加了索引就能提速,需要考虑索引添加的是否合理,sql语句是否使用到了索引.

posted @ 2019-09-02 09:12  raynduan  阅读(182)  评论(0编辑  收藏  举报