mysql数据库索引和引擎
1. 数据库索引
1.1 索引作用
当我们在数据库表中查询数据时,若没有索引,会逐个遍历表格中的所有记录,表格中数据记录量大时很耗时。建立索引就像创建目录一样,直接通过索引找到数据存储位置,加快查找。例如:有一张person表,其中有2W条记录,记录着2W个人的信息。有一个Phone的字段记录每个人的电话号码,现在想要查询出电话号码为xxxx的人的信息。
如果没有索引,那么将从表中第一条记录一条条往下遍历,直到找到该条信息为止。
如果有了索引,那么会将该Phone字段,通过一定的方法进行存储,好让查询该字段上的信息时,能够快速找到对应的数据,而不必在遍历2W条数据了。其中MySQL中的索引的存储类型有两种:BTREE、HASH。 也就是用树或者Hash值来存储该字段,要知道其中详细是如何查找的,就需要会算法的知识了。
但索引也不是越多越好,因为创建的索引也需要占用空间,而且需要维护索引,因此没必要为所有字段创建索引,对于经常需要查询,或数据记录很多的字段可以创建索引。
1.2 索引分类(index或key)
索引是在存储引擎中实现的,也就是说不同的存储引擎,会使用不同的索引
MyISAM和InnoDB存储引擎:只支持BTREE索引, 也就是说默认使用BTREE,不能够更换
MEMORY/HEAP存储引擎:支持HASH和BTREE索引
索引我们分为四类来讲 单列索引(普通索引,唯一索引,主键索引)、组合索引、全文索引、空间索引、
单列索引:一个索引只包含单个列,但一个表中可以有多个单列索引。
普通索引, INDEX:MySQL中基本索引类型,没有什么限制,允许在定义索引的列中插入重复值和空值,纯粹为了查询数据更快一点。
唯一索引,UNIQUE :索引列中的值必须是唯一的,但是允许为空值,
主键索引, PRIMARY KEY:是一种特殊的唯一索引,不允许有空值。
组合索引: 在表中的多个字段组合上创建的索引,只有在查询条件中使用了这些字段的左边字段时,索引才会被使用,使用组合索引时遵循最左前缀集合。
全文索引 FULLTEXT :只有在MyISAM引擎上才能使用 (MySQL 5.6版本的InnoDB 开始支持全文索引),只能在CHAR,VARCHAR,TEXT类型字段上使用全文索引,介绍了要求,说说什么是全文索引,就是在一堆文字中,通过其中的某个关键字等,就能找到该字段所属的记录行.
空间索引 SPATIAL : 只有在MyISAM引擎上才能使用(MySQL 5.7版本的InnoDB 开始支持),空间索引是对空间数据类型(坐标,地理位置等)的字段建立的索引,MySQL中的空间数据类型有四种,GEOMETRY、POINT、LINESTRING、POLYGON。创建空间索引的列,必须将其声明为NOT NULL
另外索引也可以分为聚集索引和非聚集索引:
聚集(clustered)索引:数据行的物理顺序与列值(一般是主键的那一列)的逻辑顺序相同,一个表中只能拥有一个聚集索引。(即主键索引)
非聚集索引(辅助索引):该索引中索引的逻辑顺序与磁盘上行的物理存储顺序不同,一个表中可以拥有多个非聚集索引。(包括普通索引,唯一索引,全文索引等)
1.3 索引操作
1.3.1 创建索引(create index): (创建索引后,通过SHOW CREATE TABLE tbname;能查看)
下面命令给titles表中的title列增加索引 (索引名称为idxtitle,未命名时默认为该字段名称),有三种方式如下:
1,创建表格时指定:
CREATE TABLE titles(
title varchar(100),
publID INT,
INDEX idxtitle (title)
);
2,创建索引: CREATE INDEX idxtitle ON titles(title);
3,修改表设计,添加索引: ALTER TABLE titles ADD INDEX idxtitle (title);
1.3.2增加不同的索引:
ALTER TABLE tablename ADD PRIMARY KEY (indexcols..); 不要写索引名称
ALTER TABLE tablename ADD INDEX [indexname] (indexcols..);
ALTER TABLE tablename ADD UNIQUE [indexname] (indexcols..);
ALTER TABLE tablename ADD FULLTEXT [indexname] (indexcols..);
ALTER TABLE tablename ADD INDEX [indexname] (indexcols1,indexcols2); 为indexcols1,indexcols2两列创建组合索引
1.3.3删除索引:
ALTER TABLE tablename DROP PRIMARY KEY ;
ALTER TABLE tablename DROP INDEX [indexname] ;
DROP indexname ON table_name;
1.3.4查看索引:
SHOW INDEX FROM table_name;
SHOW CREATE TABLE table_name;
DESC table_name
1.3.5 索引创建示例:
1 普通索引:加速查找功能 创建表时定义索引 CREATE TABLE user( nid INT NOT NULL AUTO_INCREMENT PRIMARY KEY, name VARCHAR(32) NOT NULL, age INT NOT NULL, email VARCHAR(64) NOT NULL, index n_index (name) )ENGINE=INNODB DEFAULT CHARSET=utf8; 创建表后添加索引 CREATE INDEX a_index ON user(age); 查看索引 SHOW INDEX FROM user; 删除索引 DROP INDEX a_index ON user; 注意:对于创建索引时如果是BLOB 和 TEXT 类型,必须指定length。 create index ix_extra on in1(extra(32)); 2.唯一索引功能:加速查找和唯一约束(可以为null) CREATE TABLE user( nid INT NOT NULL AUTO_INCREMENT PRIMARY KEY, name VARCHAR(32) NOT NULL, age INT NOT NULL, email VARCHAR(64) NOT NULL, UNIQUE n_index (name) )ENGINE=INNODB DEFAULT CHARSET=utf8; CREATE INDEX a_index ON user(age); SHOW INDEX FROM user; DROP INDEX a_index ON user; 3. 主键索引功能:加速查找和唯一约束(不可为null),特殊的唯一索引 -- CREATE TABLE user( -- nid INT NOT NULL AUTO_INCREMENT PRIMARY KEY, -- name VARCHAR(32) NOT NULL, -- age INT NOT NULL, -- email VARCHAR(64) NOT NULL, -- )ENGINE=INNODB DEFAULT CHARSET=utf8; -- 方式二 CREATE TABLE user( nid INT NOT NULL AUTO_INCREMENT, name VARCHAR(32) NOT NULL, age INT NOT NULL, email VARCHAR(64) NOT NULL, PRIMARY key (nid) )ENGINE=INNODB DEFAULT CHARSET=utf8; -- 创建和删除 ALTER TABLE user ADD PRIMARY KEY(name); ALTER TABLE user DROP PRIMARY KEY; ALTER TABLE user MODIFY nid INT,DROP PRIMARY KEY; 4.组合索引:组合索引是将n个列组合成一个索引 其应用场景为:频繁的同时使用n列来进行查询,如:where name = 'zack' and password = "2222222" CREATE INDEX com_index ON user(name,age); 组合索引有最左前缀性,对于上述组合索引,查询时: 查询: name and email -- 使用索引 name -- 使用索引 email -- 不使用索引 注意:对于同时搜索n个条件时,组合索引的性能好于多个单一索引合并。
1.4 索引性能测试:
先创建person表格,通过存储过程插入5000条数据
--创建表 CREATE TABLE person(id INT, name VARCHAR(16)); --存储过程 (创建函数,delimiter $$:修改终止符号为$$) delimiter $$ CREATE PROCEDURE autoinsert() BEGIN DECLARE i INT DEFAULT 1; WHILE(i<5000) DO INSERT INTO person VALUES(i,'zack'); SET i=i+1; END WHILE; END$$ delimiter ; --调用函数 CALL autoinsert();
无index时查询:SELECT * FROM person WHERE id=4900;
添加index后查询:
ALTER TABLE person ADD INDEX index_id (id);
SELECT * FROM person WHERE id=4900;
可以看出有索引时查询时间变快。
1.5.索引覆盖
索引覆盖:建立索引后并不是所有的查询都会通过索引表查询,通过索引表的查询称为索引覆盖。
常见的不会覆盖索引的情况:(通过explain语句分析,可以判断是否覆盖索引,但只是作为参考)
CREATE TABLE user( nid INT NOT NULL AUTO_INCREMENT PRIMARY KEY, name VARCHAR(32) NOT NULL, age INT NOT NULL, email VARCHAR(64) NOT NULL, index n_index(name) )ENGINE=INNODB DEFAULT CHARSET=utf8; show index from user; name列为普通索引,id列为主键索引 不会覆盖索引的情况: 1.以%开头的模糊查询:like "%cn" select * from user where name like '%cn'; 2. 使用函数: select * from user where reverse(name) = 'zack'; 3.OR语句中有一列不是索引列 select * from user where id = 1 or email = '6734@qq.com'; 下列特殊情况: select * from user where id = 1 or email = '6734@qq.com' and name = 'zack' 4. 类型不一致 (下面name列是字符串类型,传入条件时必须用引号引起来,不然不会走索引) select * from user where name = 999; 5. 使用了!= select * from user where name != 'zack'; 特别的:如果是主键,则还是会走索引 select * from user where id != 123; 6. 使用了>,< (有可能覆盖索引,不同版本不一致) select * from user where name > 'zack'; 特别的:如果是主键或索引是整数类型,则还是会走索引 select * from user where id > 123; select * from user where age > 123; 7. ORDER BY 语句根据索引列排序,选择的映射如果不是索引,则不走索引 select email from user order by name desc; 下面会走索引:select name from user order by name desc; 特别的:如果对主键排序,则还是走索引: select * from user order by id desc; 8.组合索引最左前缀原理 如果组合索引为:(name,email) name and email -- 使用索引 name -- 使用索引 email -- 不使用索引
1.6 索引数据结构
(参考:http://blog.codinglabs.org/articles/theory-of-mysql-index.html)
一般索引采用B+ Tree和B- Tree实现,MySQL的InnoDB和MyISAM都采用B+ Tree实现,但存储细节上不一样。
MyISAM存储引擎:MyISAM索引文件和数据文件是分离的,索引文件仅保存数据记录的地址(叶节点data域)。
主键索引(primary key):其结构如下,B+ Tree的叶子节点的key存放主键值,data存放主键值对应数据行的存储地址,而非叶子节点key为主键值,不存储data。查找时通过key从上往下找到叶子结点,如果key存在,拿到数据行存储地址。
辅助索引(secondary key):上图中col1为主键,在col2上建立一个辅助索引,其结构如下,可以发现其结构和主键索引没有区别,叶子节点data存放的也是数据行地址(不同之处在于主索引要求key是唯一的,而辅助索引的key可以重复)
InnoDB存储引擎:InnoDB的数据文件本身就是索引文件,叶节点data域保存了完整的数据记录
主键索引:其结构如下,B+ Tree的叶子节点key存放主键值,data存放完整的数据记录。非叶子节点key为主键值,不存储data。查找时通过key从上往下找到叶子结点,如果key存在,直接拿到数据。
辅助索引:对于辅助索引的结构如下,与主键索引不同的是,叶节点的data存放存放主键索引的值,而不是地址,因此辅助索引进行检索时需要检索两遍索引,首先检索辅助索引获得主键,然后用主键到主索引中检索获得记录。
通过上述结构发现,InnoDB数据文件即包含主键索引,所以InnoDB要求表必须有主键,如果没有显式指定,则MySQL系统会自动选择一个可以唯一标识数据记录的列作为主键,如果不存在这种列,则MySQL自动为InnoDB表生成一个隐含字段作为主键。而且不建议使用过长的字段作为主键,因为所有辅助索引都引用主索引,过长的主索引会令辅助索引变得过大。另外,用非单调的字段作为主键在InnoDB中也不建议,因为InnoDB数据文件本身是一颗B+Tree,非单调的主键会造成在插入新记录时数据文件为了维持B+Tree的特性而频繁的分裂调整,十分低效,而使用自增字段作为主键则是一个很好的选择。
2,mysql数据库引擎
https://dev.mysql.com/doc/refman/5.7/en/storage-engines.html
数据库存储引擎,是mysql用来处理SQL语句的组件,对每一个数据表格,创建时都需要指定一个数据库引擎,mysql会使用该引擎来处理这个表格的相应操作,因此对于不同引擎的表格,SQL语句的处理结果和性能会不同。另外,对于一个数据库中的表格,每个表格都可以指定不同的数据库引擎。通过命令SHOW ENGINES;能查看mysql支持的数据库引擎。主要有InnoDB,MyISAM, Memory, CSV, Archve, Blackhole等,常用的就是InnoDB,MyISAM, Memory。其中通过Create table 命令默认设置的引擎为InnoDB。
2.1 设置数据表格引擎:
创建表格时指定:CREATE TABLE titles(id INT, name VARCHAR(16)) ENGINE = InnoDB;
创建后修改:ALTER TABLE titles ENGINE = InnoDB;
(SET default_storage_engine=NDBCLUSTER;
设置默认的引擎)
2.2 InnoDB特点
https://dev.mysql.com/doc/refman/5.7/en/innodb-introduction.html
InnoDB支持事务操作,即commit,rollback和crash-recovery;
InnoDB支持行级锁,即可以给一行数据上锁;
InnoDB支持外键关系约束;
2.3 MyISAM特点
https://dev.mysql.com/doc/refman/5.7/en/myisam-storage-engine.html
MyISAM 适合读取操作较多的数据表,其读取速度较快;
MyISAM支持表级锁,可以给一张表上锁;
MyISAM支持全文索引;
MyISAM 支持Gometry,Point等表示空间位置的数据类型;
2.3 Memory:仅存在于内存中,多用于临时表格(hash index)
3.ODBC和JDBC
ODBC(open database connectivity): windows系统中数据库系统的一个驱动,基于ODBC的软件能够通过ODBC驱动来操控数据库中的数据。(如excel, access 能够通过ODBC连接MySQL 数据库,进行数据的增删改查
JDBC (java database connectivity):unix和Linux系统上数据库系统的驱动。
参考博客:https://www.cnblogs.com/whgk/p/6179612.html
http://www.cnblogs.com/yuanchenqi/articles/6357507.html
MyISAM和InnoDB的区别:https://segmentfault.com/a/1190000008227211
聚集索引与非聚集索引:https://www.cnblogs.com/s-b-b/p/8334593.html