Mysql（MyISAM和InnoDB）及Btree和索引优化

MYSQL

一、引擎

mysql：MySQL是一个关系型数据库管理系统，其中有两种引擎最为常见MyISAM和InnoDB

MyISAM（非聚集索引） 　　MySQL 5.0 之前的默认数据库引擎，最为常用。拥有较高的插入，查询速度，但不支持事务

InnoDB（聚集索引） 　　事务型数据库的首选引擎，支持ACID事务，支持行级锁定, MySQL 5.5 起成为默认数据库引擎

二、MYSQL索引：Btree索引结构。

　　 B-Tree 索引是 MySQL 数据库中使用最为频繁的索引类型，除了 Archive 存储引擎之外的其他所有的存储引擎都支持 B-Tree 索引。

　　 btree索引：通俗点说就是一颗二叉树

（图为百度出来的图，如有侵权，请私信告诉我。我只是为了让Btree更加浅显易懂，重点是我画得难看。TOT）

通俗得来说：如取35为节点，比35小的就放左边，比35大的就放右边。如果我们要寻找87叶子节点的位置，87比35大，所以在右边，然后87比39还大，所以还在右边，比65还大，所以还在右边，一共寻找3次。

Question

说到Btree索引，一直以来都有个通俗问题：对于hash索引，索引的检索可以一次定位，不像B-Tree 索引需要从根节点到枝节点，检索效率比Btree高很多，那为什么不用Hash索引却要用Btree索引？

Answer：

有以下几点原因：Hash 索引仅仅能满足"=","IN"和"<=>"查询，不能使用范围查询。

　　　　　　　　Hash 索引无法被用来避免数据的排序操作。

　　　　　　　　Hash 索引在任何时候都不能避免表扫描。

　　　　　　　　Hash 索引遇到大量Hash值相等的情况后性能并不一定就会比B-Tree索引高。

　　　　　　　　（hash 在mylsam数据表存储是范围存放，只按照节点查找，一旦多个hash值索引节点，那么就要在数据表多个位置寻找，比InnoDB中索引和数据在同一节点寻找复杂得多，所以不推荐hash）（括号的是我总结，不一定对。有错可以指出，我会修改）

三、聚集索引及其碎片维护

　　（InnoDB）聚簇结构的特点：

根据主键查询条目时,不用回行(数据就在主键节点下)
如果碰到不规则数据插入时,造成频繁的页分裂

　　为什么会产生页分裂？

这是因为聚簇索引采用的是平衡二叉树算法，而且每个节点都保存了该主键所对应行的数据，假设插入数据的主键是自增长的，那么根据二叉树算法会很快的把该数据添加到某个节点下，而其他的节点不用动；但是如果插入的是不规则的数据，那么每次插入都会改变二叉树之前的数据状态。从而导致了页分裂。

　　优化：

聚簇索引的主键值,应尽量是连续增长的值,而不是要是随机值, (不要用随机字符串或UUID)，否则会造成大量的页分裂与页移动。在使用InnoDB的时候最好定义成：

id int unsigned primary key auto_increment

索引选择性与前缀索引

因为索引虽然加快了查询速度，但索引也是有代价的，另外，MySQL在运行时也要消耗资源维护索引，因此索引并不是越多越好。

一般两种情况下不建议建索引。
1.表记录比较少，超过2000条可以酌情考虑索引。
2.索引的选择性较低。所谓索引的选择性（Selectivity），是指不重复的索引值（也叫基数，Cardinality）与表记录数（#T）的比值：
Index Selectivity = Cardinality / #T

显然选择性的取值范围为(0, 1]，选择性越高的索引价值越大，这是由B+Tree的性质决定的。

使用索引扫描来优化排序条件
1.索引的列顺序和Order by子句的顺序完全一致
2.索引中所有列的方向（升序，降序）和Order by子句完全一致
3.Order by中的字段全部在关联表中的第一张表中

四、MYSQL 优化命令查询

1、查版本号

无论做什么都要确认版本号，不同的版本号下会有各种差异。

>Select version();

2、执行状态分析

显示哪些线程正在运行

>show processlist; （端口号给我马赛克了，见谅见谅，安全起见）

3、Show profile

精确两位数，小数点。

show profile默认的是关闭的，但是会话级别可以开启这个功能，开启它可以让MySQL收集在执行语句的时候所使用的资源。

分析SQL执行带来的开销是优化SQL的常用手段，在MySQL数据库中，可以通过配置profiling参数来启用SQL剖析。
它只能在session级别来设置，设置后影响当前session；当它开启后，后续执行的SQL语句都将记录其资源开销，诸如IO，上下文，CPU，MEMORY等。

开启profiling,有个警告，这个参数在以后会被删除，用information_scheam.PROFILING替代。

（设置profiling=1，开启profile）

（使用命令：show profile 观看执行时间，15行受影响）

根据query id查看某个查询得详细时间耗时。

Explain的列分析

如查询语句：

查询语句是explain select * from goods order by goods_id asc \G

posted @ 2018-09-10 22:58 Final_static_杨阅读(2076) 评论(0) 收藏举报

刷新页面返回顶部