索引以及查询结构
什么是索引
搜索引擎 索引是一个特殊的数据结构 其存储的是数据的关键信息和详细信息的位置对应关系
例如 书的目录
为什么需要索引
加速查询,当数据量非常大的时候,查询某一个数据是非常慢的
索引的影响
-
不是说有了索引就能加速,得看你的查询语句有没有正确使用索引
-
索引也需要占用额外的数据空间
-
添加索引后将导致,增删改变慢--写入
什么样的数据应该添加索引:
查询操作较多写入较少并且数据链很大时
查询和写入操作的占比,10:1或者查询更多
本质上索引原理是尽可能的减小索引范围,降低IO操作
磁盘IO
平均查找一个数据需要花费至少9ms 这段是CPU 就会切换到其他的程序
我们要加速查询 必须至少IO操作的次数
索引数据结构
b+树
在b+树种,叶子结点才是存储真实数据的,叶子数量越多,树的层级越高,导致IO次数增加
要避免这个问题,在叶子节点尽可能的存储更多的数据,应该将数据量小的字段作为索引
最左匹配原则
当b+树的数据项目是复合的数据结构,比如(name,age,sex)的时候(多字段联合索引),b+树会按照从左到右的顺序来建立搜索树,比如当(张三,20,F)这样的数据来检索的时候 ,b+树会优先比较name来确定下一步的所搜方向,如果name相同再依次比较age和sex,最后得到索引的数据;但当(20,F)这样的没有name的数据来的时候,b+树就不知道下一步该查那个节点,因为建立搜索树的时候name就是第一个比较因子,必须要先根据name来搜索才能知道下一布去哪里查询,比如当(张三,F)这样的数据来检索的时候,b+树可以用name来制定搜索方向,单下一个字段age的缺失,所有只能吧名字等于张三的数据都找到,然后匹配性别是F的互数据,这个是非常重要的性质,即索引的最走匹配特性
聚集索引
聚集索引中包含了所有字段的值,如果制定了主键,主键就是聚集索引,如果没有则找一个非空且唯一的字段作为聚集索引,若果也找不着,自动生成一个字段作为聚集索引
辅助索引
除了聚集索引以外的都叫辅助索引
覆盖查询
指的是在当前索引结构中就能找到所有需要的数据,如果使用的聚集索引迎来查询那么一定是覆盖查询,速度是最快的
回表查询
指的是在当前索引结构中找不到所需的数据,需要听过id去聚集索引中查询,速度慢与聚集索引
结论
-
使用占用空间最小的字段来作为索引
-
不要在一行中存储太多的数据,比如视频,字段太多可以分表
-
尽量使用覆盖查询
-
如果字段区分度低(重复度高),建立索引是没有意义的,反过来说应该将区分度高的字段作为索引
-
模糊匹配中,百分号尽量不要写在前面
-
不要在等号的左边做运算
例如 : select count(*) from user where id * 3 = 6;也会遍历所有记录
-
and语句中会自动找一个具备缩印的字段优先执行,所以我们应该在and语句中至少包含一个具备索引的字段
-
or语句要避免使用,如果要用则保证所有的字段都有索引才能急速
-
联合索引中,顺序应该将区分度最高的放到左边,最低的放右边
查询语句中必须保证最左边的索引出现在语句中
另外需要注意的如果要查询的数据量非常大,索引无法加速
总结:不是添加了索引就能提速,需要考虑索引添加的是否合理,sql语句是否用到了索引
语法
创建索引的语法:
create index 索引的名字 on 表名(字段名)
联合索引
create index 索引的名字 on 表的名字(字段名,字段名)
create index union_index on usr(id,email,name,gender)
删除索引