Mysql-索引
Mysql-索引
1. 概念
索引是一个排序的列表,在这个列表中存储着索引的值和包含这个值的数据所在行的物理地址(类似于c语言的链表通过指针指向数据记录的内存地址)
使用索引后可以不用扫描全表来定位某行的数据,而是先通过索引表找到该行数据对应的物理地址然后访问相应的数据,因此能加快数据库的查询速度。
索引就好比是一本书的目录,可以根据目录中的页码快速找到所需的内容。
索引是表中一列或者若干列值排序的方法。
建立索引的目的是加快对表中记录的查找或排序。
2. 作用与副作用
2.1正作用
设置了合适的索引之后,数据库利用各种快速定位技术,能够大大加快查询速度,这是创建索引的最主要的原因。
当表很大或查询涉及到多个表时,使用索引可以成千.上万倍地提高查询速度。
可以降低数据库的I0成本,并且索引还可以降低数据库的排序成本。
通过创建唯一性索引,可以保证数据表中每一行数据的唯一性。
可以加快表与表之间的连接。
在使用分组和排序时,可大大减少分组和排序的时间。
建立索引在搜索和恢复数据库中的数据时能显著提高性能。
2.2副作用
索引的副作用:
●索引需要占用额外的磁盘空间。
对于MyISAM 引擎而言,索引文件和数据文件是分离的,索引文件用于保存数据记录的地址。而InnoDB 引擎的表数据文件本身就是索引文件。
●在插入和修改数据时要花费更多的时间,因为索引也要随之变动。
3. 创建原则
索引虽可以提升数据库查询的速度,但并不是任何情况下都适合创建索引。因为索引本身会消耗系统资源,在有索引的情况下,数据库会先进行索引查询,然后定位到具体的数据行,如果索引使用不当,反而会增加数据库的负担。
●表的主键、外键必须有索引。因为主键具有唯--性,外键关联的是主表的主键,查询时可以快速定位。
●记录数超过300行的表应该有索引。如果没有索引,每次查询都需要把表遍历一遍,会严重影响数据库的性能。
●经常与其他表进行连接的表,在连接字段上应该建立索引。
●唯一性太差的字段不适合建立索引。
●更新太频繁地字段不适合创建索引。
●经常出现在where子句中的字段,特别是大表的字段,应该建立索引。
●在经常进行GROUP BY、 ORDER BY的字段上建立索引;
●索引应该建在选择性高的字段上(值唯一性)
●索引应该建在小字段上,对于大的文本字段甚至超长字段,不要建索引。
4.索引分类
4.1 普通索引
基本索引,没有唯一性的限制
创建方式:
-
直接创建
CREATE INDEX 索引名 ON 表名(列名[ (length)]);
(列名(length)): length是可选项, 下同。如果忽略length 的值,则使用整个列的值作为索引。如果指定,使用列的前length个字符来创建索引,这样有利于减小索引文件的大小。在不损失精确性的情况下,长度越短越好。
索引名建议以“_index"结尾。
-
修改表方式创建
ALTER TABLE 表名 ADD INDEX 索引名(列名) ;
-
创建表时指定索引
CREATE TABLE 表名(字段1数据类型,字段2数据类型[,...], INDEX索引名(列名));
4.2 唯一索引
与普通索引类似,但区别是唯一索引列的每个值都唯一。
唯一索引允许有空值(注意和主键不同)。如果是用组合索引创建,则列值的组合必须唯一。添加唯一键将自动创建唯索引。
创建方式:
-
直接创建
直接创建唯一索引:
CREATE UNIQUE INDEX 索引名 ON 表名(列名) ;
-
修改表结构
修改表方式创建
ALTER TABLE 表名ADD UNIQUE 索引名(列名) ;
-
创建表方式
创建表的时候指定
CREATE TABLE表名(字段1 数据类型,字段2数据类型[...],UNIQUE索引名(列名));
4.3 主键索引
主键索引:是一种特殊的唯一索引, 必须指定为“PRIMARY KEY”。一个表只能有一个主键,不允许有空值。添加主键将自动创建主键索引。
4.4 组合(索引)
组合索引(单列索引与多列索引) :可以是单列上创建的索引,也可以是在多列上创建的索引。需要满足最左原则,因为select 语句的where条件是依次从左往右执行的,所以在使用select 语句查询时where条件使用的字段顺序必须和组合索引中的排序一致,否则索引将不会生效。
-
创建
CREATE TABLE表名(列名1数据类型,列名2数据类型,列名3数据类型, INDEX索引名(列名1, 列名2,列名3));
查询时使用索引。
select * from表名where 列名1='...' AND 列名 2='...' AND列名3='...';
聚集索引与非聚集索引
聚集索引也称为聚簇索引,在聚集索引中,表中行的物理顺序与键值的逻辑(索引)顺序相同。一个表只能包含一个聚集索引, 即如果存在聚集索引,就不能再指定CLUSTERED 关键字。
非聚集索引也叫非簇索引,在非聚集索引中,数据库表中记录的物理顺序与索引顺序可以不相同。一个表中只能有一个聚集索引,但表中的每一列都可以有自己的非聚集索引。
4.5 全文索引
全文索引(FULLTEXT) :适合在进行模糊查询的时候使用,可用于在一篇文章中检索文本信息。
在MySQL5.6 版本以前FULLTEXT索引仅可用于MyISAM引擎警,在5.6 版本之后innodb 引擎也支持FULLTEXT索引。
全文索引可以在CHAR、VARCHAR或者TEXT 类型的列上创建。每个表一般只有一个全文索引
5. 索引的其他相关命令
删除索引
DROP INDEX <索引名> ON <表名>
ALTER TABLE <表名> DROP INDEX <索引名>;
查询索引
show index from <表名>;
show keys from <表名>;
各字段的含义如下:
Table:表的名称。
Non unique: 如果索引不能包括重复词,则为0;如果可以,则为1。
Key_name:索引的名称。
Seq_in_index:索引中的列序号,从1开始。
Column_name:列名称。
Collation:列以什么方式存储在索引中。在MySQL中,有值ASC'(升序)或NULL (无分类)。
Cardinality:索引中唯一值数目的估计值。
Sub_part:如果列只是被部分地编入索引,则为被编入索引的字符的数目。如果整列被编入索引,则为NULL。
Packed:指示关键字如何被压缩。如果没有被压缩,则为NULL。
Null:如果列含有NULL, 则含有YES。如果没有,则该列含有NO。
Index_ type: 用过的索引方法( BTREE,FULLTEXT,HASH, RTREE) 。
Comment:备注。
分析索引的使用
- explain <select语句>
6.索引速度测试
现有一个employee表,数据有300024条。
mysql> select count(*) from employees;
+----------+
| count(*) |
+----------+
| 300024 |
+----------+
1 row in set (0.03 sec)
查看该表的索引。有一个主键索引emp_no。
mysql> show index from employees;
+-----------+------------+----------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+
| Table | Non_unique | Key_name | Seq_in_index | Column_name | Collation | Cardinality | Sub_part | Packed | Null | Index_type | Comment | Index_comment |
+-----------+------------+----------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+
| employees | 0 | PRIMARY | 1 | emp_no | A | 299202 | NULL | NULL | | BTREE | | |
+-----------+------------+----------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+
查看emp_no id在20023和20043之间的数据。
mysql> select * from employees where emp_no between 20023 and 20043;
+--------+------------+------------+-------------+--------+------------+
| emp_no | birth_date | first_name | last_name | gender | hire_date |
+--------+------------+------------+-------------+--------+------------+
| 20023 | 1952-02-09 | Nahla | Jervis | M | 1991-08-10 |
| 20024 | 1954-09-23 | Martine | Kambil | M | 1986-05-06 |
| 20025 | 1963-02-13 | Yakkov | Peek | F | 1987-01-31 |
| 20026 | 1953-03-25 | Sanjai | Marrevee | F | 1991-09-23 |
| 20027 | 1957-07-17 | Vidar | Atrawala | M | 1993-04-22 |
| 20028 | 1959-12-25 | Kasidit | Passino | M | 1992-10-04 |
| 20029 | 1964-01-04 | Doowon | Socorro | M | 1991-03-05 |
| 20030 | 1962-05-09 | Nitsan | Hoppenstand | F | 1988-11-18 |
| 20031 | 1962-11-20 | Kenton | Bernini | M | 1985-10-01 |
| 20032 | 1955-11-20 | Cheong | Socorro | M | 1989-04-07 |
| 20033 | 1956-10-10 | Dulce | Azevdeo | F | 1992-11-03 |
| 20034 | 1956-12-03 | Jaques | Baby | M | 1993-07-30 |
| 20035 | 1959-04-25 | Guoxiang | Trogemann | M | 1985-11-11 |
| 20036 | 1963-01-19 | Jaber | Katiyar | M | 1986-08-14 |
| 20037 | 1954-09-07 | Tse | VanScheik | M | 1986-09-24 |
| 20038 | 1962-04-02 | Tremaine | Gente | M | 1992-08-31 |
| 20039 | 1952-06-07 | Udo | Harbusch | F | 1987-09-19 |
| 20040 | 1962-04-16 | Youjian | Vingron | M | 1987-01-21 |
| 20041 | 1952-06-14 | Chikara | Lienhardt | F | 1990-02-23 |
| 20042 | 1955-10-18 | Margareta | Munck | F | 1987-03-23 |
| 20043 | 1952-09-13 | Chikara | Adachi | M | 1985-03-21 |
+--------+------------+------------+-------------+--------+------------+
21 rows in set (0.00 sec)
时间使用0.00 sec
删除索引。
mysql> ALTER TABLE employees DROP PRIMARY KEY;
Query OK, 300024 rows affected (0.47 sec)
Records: 300024 Duplicates: 0 Warnings: 0
再次运行
mysql> select * from employees where emp_no between 20023 and 20043;
+--------+------------+------------+-------------+--------+------------+
| emp_no | birth_date | first_name | last_name | gender | hire_date |
+--------+------------+------------+-------------+--------+------------+
| 20023 | 1952-02-09 | Nahla | Jervis | M | 1991-08-10 |
| 20024 | 1954-09-23 | Martine | Kambil | M | 1986-05-06 |
| 20025 | 1963-02-13 | Yakkov | Peek | F | 1987-01-31 |
| 20026 | 1953-03-25 | Sanjai | Marrevee | F | 1991-09-23 |
| 20027 | 1957-07-17 | Vidar | Atrawala | M | 1993-04-22 |
| 20028 | 1959-12-25 | Kasidit | Passino | M | 1992-10-04 |
| 20029 | 1964-01-04 | Doowon | Socorro | M | 1991-03-05 |
| 20030 | 1962-05-09 | Nitsan | Hoppenstand | F | 1988-11-18 |
| 20031 | 1962-11-20 | Kenton | Bernini | M | 1985-10-01 |
| 20032 | 1955-11-20 | Cheong | Socorro | M | 1989-04-07 |
| 20033 | 1956-10-10 | Dulce | Azevdeo | F | 1992-11-03 |
| 20034 | 1956-12-03 | Jaques | Baby | M | 1993-07-30 |
| 20035 | 1959-04-25 | Guoxiang | Trogemann | M | 1985-11-11 |
| 20036 | 1963-01-19 | Jaber | Katiyar | M | 1986-08-14 |
| 20037 | 1954-09-07 | Tse | VanScheik | M | 1986-09-24 |
| 20038 | 1962-04-02 | Tremaine | Gente | M | 1992-08-31 |
| 20039 | 1952-06-07 | Udo | Harbusch | F | 1987-09-19 |
| 20040 | 1962-04-16 | Youjian | Vingron | M | 1987-01-21 |
| 20041 | 1952-06-14 | Chikara | Lienhardt | F | 1990-02-23 |
| 20042 | 1955-10-18 | Margareta | Munck | F | 1987-03-23 |
| 20043 | 1952-09-13 | Chikara | Adachi | M | 1985-03-21 |
+--------+------------+------------+-------------+--------+------------+
21 rows in set (0.06 sec)
已出现时间0.06sec。