浅谈数据库索引的结构设计与优化

浅谈数据库索引的结构设计与优化

思考索引的问题：

　　　　1.为什么主键索引比非主键索引快？

　　　　2.为什么sql使用like关键字 “%XXX%”无法走索引，而“XXX%”可以？

　　　　3.为什么有索引的字段，数据量大了后，增删改会很慢？

一. 了解数据库索引的必要性

　　对于稍微数据量大一点的表，如果不适用索引，那么性能效率都会很低；如果绕开了索引，直接进行分区分表，数据库集群读写分离来解决性能问题的话，那么未免也太小题大做了。

　　对于大多数中小型系统，索引能够帮你解决90%的性能问题，所以索引是解决关系型数据库非常有利的武器。

二. 表和索引结构

　　1.索引结构

浅谈下B-TREE和B+TREE结构

B-TREE

　　　　

　　　　B+TREE

　　　　

区别点:

B-Tree的关键字分布在各个节点,不会重复出现. 而B+Tree的关键字都会出现在叶子节点
B+Tree的非叶子节点不会保存数据信息. 数据信息都在叶子节点中
B+Tree的叶子节点从左到右顺序排列,并且存在指针连接,是一个链表结构

　　3.硬件特性

　　　　硬盘磁盘的图可以用下图简单表示:

　　　　　　

　　　　我们的数据库表里的数据就保存在磁盘上，如果要读取数据，就要砖头磁盘，用磁头和磁盘的磁力来改变状态，来读取数据，所以，我们应该尽量少的转动磁盘，来优化数据库性能。

三.SQL处理过程

　　

四.为SELECT语句创建理想索引

　　1.三星索引

　　三星索引是指一条sql所能达到索引的最优设计。

　　第一颗星：

　　　　如果与一个查询相关的索引行是相邻的，那么这个索引就为第一颗星。

　　第二颗星：

　　　　如果索引行的顺序与查询语句一致，则为第二颗星。

　　第三颗星：

　　　　查询的数据为索引的信息，不需要额外的磁盘随机读。这一颗星能大大改善性能。

　　假设有一条sql语句如下所示：

　　　　

　　如果要满足一星索引：索引的顺序可以是LNAME,CITY或者CITY,LNAME

　　如果要满足第二星索引：FNAME加在LNAME,CITY或者CITY,LNAME后面

　　如果要满足第三索引：CNO也要在索引里面

　　那么组合起来得三星索引就是：LNAME,CITY,FNAME,CNO或者CITY,LNAME,FNAME,CNO

五.前瞻性索引

　　1.发现不合适的索引

　　有两种基本的方法来发现不合适的索引：

　　　　　　　　　　　　1.基本问题法(BQ)

　　　　　　　　　　　　2.快速上线评估法(QUBE)

　　在这里我仅仅讨论一下快速上线评估法(QUBE)

　　

　　2.快速上线评估法(QUBE)

　　　QUBE是悲观上限，它的目的是在早期发现程序设计的缺陷，并且及时更改。QUBE忽略了排队时间，锁竞争时间等，把问题单一化来评估sql的性能问题。

　　　下图就是QUBE计算评估sql时间公式：

　　　　　　　　　　　　　　

　　可以发现，TR和TS存在巨大的时间差距，随机访问会消耗大量的时间，那么来说说随机和顺序访问。

　　随机访问：

　　　　先说一说磁盘读和访问的区别。读是读取一页的信息，访问时访问一行的信息。所以单次随机访问的时间与一次磁盘随机读取的时间相同，都是10ms。

　　顺序访问：

　　　　一次顺序读是指物理上读取连续的下一行，这一行要么在同一页中，要么在下一页中，估算出来时间是0.01ms。

　　FETCH:

　　　　是FETCH调用次数来确定被接收行的数量。F的时间数量级要比TS大一级，但是要比TR小2级。

　　下面给出一个简单的事例来说明QUBE计算方法：

　　　　　　

　　那么可以根据上面的公式得到：

　　　　　　

　　QUBE算法其实可以多结合自己的项目事例来计算判断一下，因为这个公式是很多年前的了，现在磁盘读写能力肯定有了显著提升，但是判断sql性能的方式是一致的。

　　但是依照现目前的数据库磁盘读写能力和缓存技术，10ms的随机读可以换算成1ms.

　　　　　　

posted on 2019-04-19 13:34 流星划过天际阅读(1102) 评论(0) 收藏举报

刷新页面返回顶部