mysql数据库索引和引擎

1. 数据库索引

　　1.1 索引作用

　　　　当我们在数据库表中查询数据时，若没有索引，会逐个遍历表格中的所有记录，表格中数据记录量大时很耗时。建立索引就像创建目录一样，直接通过索引找到数据存储位置，加快查找。例如：有一张person表，其中有2W条记录，记录着2W个人的信息。有一个Phone的字段记录每个人的电话号码，现在想要查询出电话号码为xxxx的人的信息。

　　　如果没有索引，那么将从表中第一条记录一条条往下遍历，直到找到该条信息为止。

　　如果有了索引，那么会将该Phone字段，通过一定的方法进行存储，好让查询该字段上的信息时，能够快速找到对应的数据，而不必在遍历2W条数据了。其中MySQL中的索引的存储类型有两种：BTREE、HASH。也就是用树或者Hash值来存储该字段，要知道其中详细是如何查找的，就需要会算法的知识了。

　　　　但索引也不是越多越好，因为创建的索引也需要占用空间，而且需要维护索引，因此没必要为所有字段创建索引，对于经常需要查询，或数据记录很多的字段可以创建索引。

　　1.2 索引分类(index或key)

　　　　索引是在存储引擎中实现的，也就是说不同的存储引擎，会使用不同的索引

　　　　　　MyISAM和InnoDB存储引擎：只支持BTREE索引，也就是说默认使用BTREE，不能够更换

　　　　　　 MEMORY/HEAP存储引擎：支持HASH和BTREE索引

　　　　索引我们分为四类来讲单列索引(普通索引，唯一索引，主键索引)、组合索引、全文索引、空间索引、

　　　　　　单列索引：一个索引只包含单个列，但一个表中可以有多个单列索引。

　　　　　　　　 普通索引, INDEX：MySQL中基本索引类型，没有什么限制，允许在定义索引的列中插入重复值和空值，纯粹为了查询数据更快一点。

　　　　　　　　 唯一索引,UNIQUE ：索引列中的值必须是唯一的，但是允许为空值，　　　

　　　　　　　　 主键索引， PRIMARY KEY：是一种特殊的唯一索引，不允许有空值。　　　　　　　　　

　　　　　　组合索引: 在表中的多个字段组合上创建的索引，只有在查询条件中使用了这些字段的左边字段时，索引才会被使用，使用组合索引时遵循最左前缀集合。

　　　　　　全文索引 FULLTEXT :只有在MyISAM引擎上才能使用 (MySQL 5.6版本的InnoDB 开始支持全文索引)，只能在CHAR,VARCHAR,TEXT类型字段上使用全文索引，介绍了要求，说说什么是全文索引，就是在一堆文字中，通过其中的某个关键字等，就能找到该字段所属的记录行.

　　　　　　空间索引 SPATIAL : 只有在MyISAM引擎上才能使用（MySQL 5.7版本的InnoDB 开始支持)，空间索引是对空间数据类型（坐标，地理位置等）的字段建立的索引，MySQL中的空间数据类型有四种，GEOMETRY、POINT、LINESTRING、POLYGON。创建空间索引的列，必须将其声明为NOT NULL

　　　另外索引也可以分为聚集索引和非聚集索引：

　　　　　聚集（clustered）索引：数据行的物理顺序与列值（一般是主键的那一列）的逻辑顺序相同，一个表中只能拥有一个聚集索引。（即主键索引）

　　　　　非聚集索引(辅助索引)：该索引中索引的逻辑顺序与磁盘上行的物理存储顺序不同，一个表中可以拥有多个非聚集索引。（包括普通索引，唯一索引，全文索引等）

　　　1.3 索引操作

　　　　 1.3.1 创建索引（create index）： （创建索引后，通过SHOW CREATE TABLE tbname;能查看）

　　　　　下面命令给titles表中的title列增加索引 (索引名称为idxtitle，未命名时默认为该字段名称)，有三种方式如下：

　　　　　1，创建表格时指定：

　　　　　 CREATE TABLE titles(

　　　　　　　　　　　title varchar(100),

　　　　　　　　　　 publID INT,

　　　　　　　　　　 INDEX idxtitle (title)

　　　　　　　　　　)；

　　　　　　　　2，创建索引： CREATE INDEX idxtitle ON titles(title)；

　　　　　　　　3，修改表设计，添加索引： ALTER TABLE titles ADD INDEX idxtitle (title)；

　　　　 1.3.2增加不同的索引：

　　　　　　　　ALTER TABLE tablename ADD PRIMARY KEY （indexcols..）; 不要写索引名称

　　　　　　　　ALTER TABLE tablename ADD INDEX [indexname] （indexcols..）;

　　　　　　　　ALTER TABLE tablename ADD UNIQUE [indexname] （indexcols..）;

　　　　　　　　ALTER TABLE tablename ADD FULLTEXT [indexname] （indexcols..）;

　　　　　　　　ALTER TABLE tablename ADD INDEX [indexname] （indexcols1，indexcols2）; 为indexcols1，indexcols2两列创建组合索引

　　　 1.3.3删除索引：

　　　　　　　　ALTER TABLE tablename DROP PRIMARY KEY ;

　　　　　　　　ALTER TABLE tablename DROP INDEX [indexname] ;

　　　　　　　　DROP indexname ON table_name;

　　　　　　1.3.4查看索引：

　　　　　　　　SHOW INDEX FROM table_name;

　　　　　　　　SHOW CREATE TABLE table_name;

　　　　　　　　DESC table_name

　　　　　　1.3.5 索引创建示例：　　　

1 普通索引：加速查找功能

创建表时定义索引
CREATE TABLE user(
    nid INT NOT NULL AUTO_INCREMENT PRIMARY KEY,
    name VARCHAR(32) NOT NULL,
    age INT NOT NULL,
    email VARCHAR(64) NOT NULL,
    index n_index (name)
)ENGINE=INNODB DEFAULT CHARSET=utf8;

创建表后添加索引
CREATE INDEX a_index ON user(age);
查看索引
SHOW INDEX FROM user;
删除索引
DROP INDEX a_index ON user;

注意：对于创建索引时如果是BLOB 和 TEXT 类型，必须指定length。
create index ix_extra on in1(extra(32));

2.唯一索引功能：加速查找和唯一约束（可以为null）
CREATE TABLE user(
    nid INT NOT NULL AUTO_INCREMENT PRIMARY KEY,
    name VARCHAR(32) NOT NULL,
    age INT NOT NULL,
    email VARCHAR(64) NOT NULL,
    UNIQUE n_index (name)
)ENGINE=INNODB DEFAULT CHARSET=utf8;

CREATE INDEX a_index ON user(age);

SHOW INDEX FROM user;

DROP INDEX a_index ON user;

3. 主键索引功能：加速查找和唯一约束（不可为null），特殊的唯一索引
-- CREATE TABLE user(
--     nid INT NOT NULL AUTO_INCREMENT PRIMARY KEY,
--     name VARCHAR(32) NOT NULL,
--     age INT NOT NULL,
--     email VARCHAR(64) NOT NULL,
-- )ENGINE=INNODB DEFAULT CHARSET=utf8;
-- 方式二
CREATE TABLE user(
    nid INT NOT NULL AUTO_INCREMENT,
    name VARCHAR(32) NOT NULL,
    age INT NOT NULL,
    email VARCHAR(64) NOT NULL,
    PRIMARY key (nid)
)ENGINE=INNODB DEFAULT CHARSET=utf8;

-- 创建和删除
ALTER TABLE user ADD PRIMARY KEY(name);
ALTER TABLE user DROP PRIMARY KEY;
ALTER TABLE user MODIFY nid INT,DROP PRIMARY KEY;

4.组合索引：组合索引是将n个列组合成一个索引
其应用场景为：频繁的同时使用n列来进行查询，如：where name = 'zack' and password = "2222222"

CREATE INDEX com_index ON user(name,age);
组合索引有最左前缀性，对于上述组合索引，查询时：
查询：
    name and email  -- 使用索引
    name            -- 使用索引
    email           -- 不使用索引
注意：对于同时搜索n个条件时，组合索引的性能好于多个单一索引合并。

四种索引操作示例

　　　1.4 索引性能测试：

　　　　　先创建person表格，通过存储过程插入5000条数据　　　

--创建表 

CREATE TABLE person(id INT, name VARCHAR(16));

--存储过程 （创建函数，delimiter $$：修改终止符号为$$）   

delimiter $$

CREATE PROCEDURE autoinsert()
BEGIN
DECLARE i INT DEFAULT 1;
WHILE(i<5000) DO
INSERT INTO person VALUES(i,'zack');
SET i=i+1;
END WHILE;
END$$

delimiter ;

--调用函数

CALL autoinsert();

创建person表

无index时查询：SELECT * FROM person WHERE id=4900;

添加index后查询：

　　　　　　　　　　ALTER TABLE person ADD INDEX index_id (id);

　　　　　　　　　　SELECT * FROM person WHERE id=4900;

　　　可以看出有索引时查询时间变快。

　　1.5.索引覆盖

　　　　索引覆盖：建立索引后并不是所有的查询都会通过索引表查询，通过索引表的查询称为索引覆盖。

　　　　常见的不会覆盖索引的情况：（通过explain语句分析，可以判断是否覆盖索引，但只是作为参考）

CREATE TABLE user(
    nid INT NOT NULL AUTO_INCREMENT PRIMARY KEY,
    name VARCHAR(32) NOT NULL,
    age INT NOT NULL,
    email VARCHAR(64) NOT NULL,
    index n_index(name)
)ENGINE=INNODB DEFAULT CHARSET=utf8;

show index from user;
name列为普通索引,id列为主键索引


不会覆盖索引的情况：
1.以%开头的模糊查询：like "%cn"
    select * from user where name like '%cn';

2. 使用函数：
    select * from user where reverse(name) = 'zack';
    
3.OR语句中有一列不是索引列
    select * from user where id = 1 or email = '6734@qq.com';
    下列特殊情况：
    select * from user where id = 1 or email = '6734@qq.com' and name = 'zack'
        
4. 类型不一致
     （下面name列是字符串类型，传入条件时必须用引号引起来，不然不会走索引）
        select * from user where name = 999;
        
5. 使用了!=
    select * from user where name != 'zack';
  特别的：如果是主键，则还是会走索引
        select * from user where id != 123;
                
6. 使用了>,< （有可能覆盖索引，不同版本不一致）
        select * from user where name > 'zack';
    特别的：如果是主键或索引是整数类型，则还是会走索引
        select * from user where id > 123;
        select * from user where age > 123;
                
7. ORDER BY 语句根据索引列排序，选择的映射如果不是索引，则不走索引
      select email from user order by name desc;
        下面会走索引：select name from user order by name desc;
    特别的：如果对主键排序，则还是走索引：
        select * from user order by id desc;
                
8.组合索引最左前缀原理
     如果组合索引为：(name,email)
    name and email       -- 使用索引
    name                 -- 使用索引
    email                -- 不使用索引

覆盖索引

　 1.6 索引数据结构

　　　　　（参考：http://blog.codinglabs.org/articles/theory-of-mysql-index.html）

　　　　　一般索引采用B+ Tree和B- Tree实现，MySQL的InnoDB和MyISAM都采用B+ Tree实现，但存储细节上不一样。

　　　　　MyISAM存储引擎：MyISAM索引文件和数据文件是分离的，索引文件仅保存数据记录的地址（叶节点data域）。

　　　　　　　主键索引（primary key）：其结构如下，B+ Tree的叶子节点的key存放主键值，data存放主键值对应数据行的存储地址，而非叶子节点key为主键值，不存储data。查找时通过key从上往下找到叶子结点，如果key存在，拿到数据行存储地址。

　　　　　　辅助索引(secondary key)：上图中col1为主键，在col2上建立一个辅助索引，其结构如下，可以发现其结构和主键索引没有区别，叶子节点data存放的也是数据行地址（不同之处在于主索引要求key是唯一的，而辅助索引的key可以重复）

　　　　　InnoDB存储引擎：InnoDB的数据文件本身就是索引文件，叶节点data域保存了完整的数据记录

　　　　　　　主键索引：其结构如下，B+ Tree的叶子节点key存放主键值，data存放完整的数据记录。非叶子节点key为主键值，不存储data。查找时通过key从上往下找到叶子结点，如果key存在，直接拿到数据。

　　　　　　　辅助索引：对于辅助索引的结构如下，与主键索引不同的是，叶节点的data存放存放主键索引的值，而不是地址，因此辅助索引进行检索时需要检索两遍索引,首先检索辅助索引获得主键，然后用主键到主索引中检索获得记录。

　　　　　　　通过上述结构发现，InnoDB数据文件即包含主键索引，所以InnoDB要求表必须有主键，如果没有显式指定，则MySQL系统会自动选择一个可以唯一标识数据记录的列作为主键，如果不存在这种列，则MySQL自动为InnoDB表生成一个隐含字段作为主键。而且不建议使用过长的字段作为主键，因为所有辅助索引都引用主索引，过长的主索引会令辅助索引变得过大。另外，用非单调的字段作为主键在InnoDB中也不建议，因为InnoDB数据文件本身是一颗B+Tree，非单调的主键会造成在插入新记录时数据文件为了维持B+Tree的特性而频繁的分裂调整，十分低效，而使用自增字段作为主键则是一个很好的选择。

2，mysql数据库引擎

https://dev.mysql.com/doc/refman/5.7/en/storage-engines.html

　　数据库存储引擎，是mysql用来处理SQL语句的组件，对每一个数据表格，创建时都需要指定一个数据库引擎，mysql会使用该引擎来处理这个表格的相应操作，因此对于不同引擎的表格，SQL语句的处理结果和性能会不同。另外，对于一个数据库中的表格，每个表格都可以指定不同的数据库引擎。通过命令SHOW ENGINES;能查看mysql支持的数据库引擎。主要有InnoDB，MyISAM, Memory, CSV, Archve, Blackhole等，常用的就是InnoDB，MyISAM, Memory。其中通过Create table 命令默认设置的引擎为InnoDB。

　　2.1 设置数据表格引擎：

　　　创建表格时指定：CREATE TABLE titles(id INT, name VARCHAR(16)) ENGINE = InnoDB;

　　　　创建后修改：ALTER TABLE titles ENGINE = InnoDB;

　　 (SET default_storage_engine=NDBCLUSTER; 设置默认的引擎)

　　2.2 InnoDB特点

　　　　https://dev.mysql.com/doc/refman/5.7/en/innodb-introduction.html

　　　　InnoDB支持事务操作，即commit，rollback和crash-recovery；

　　　　InnoDB支持行级锁，即可以给一行数据上锁；

　　　　InnoDB支持外键关系约束；

　　2.3 MyISAM特点

　　　　https://dev.mysql.com/doc/refman/5.7/en/myisam-storage-engine.html

　　　 MyISAM 适合读取操作较多的数据表，其读取速度较快；

　　　　MyISAM支持表级锁，可以给一张表上锁；

　　　　MyISAM支持全文索引；

　　　　MyISAM 支持Gometry，Point等表示空间位置的数据类型；

　　2.3 Memory：仅存在于内存中，多用于临时表格（hash index）

3.ODBC和JDBC

　　ODBC（open database connectivity）: windows系统中数据库系统的一个驱动，基于ODBC的软件能够通过ODBC驱动来操控数据库中的数据。（如excel, access 能够通过ODBC连接MySQL 数据库，进行数据的增删改查

　　JDBC (java database connectivity)：unix和Linux系统上数据库系统的驱动。

参考博客：https://www.cnblogs.com/whgk/p/6179612.html

　　　　 http://www.cnblogs.com/yuanchenqi/articles/6357507.html

　　 MyISAM和InnoDB的区别：https://segmentfault.com/a/1190000008227211

　　　　　聚集索引与非聚集索引：https://www.cnblogs.com/s-b-b/p/8334593.html

　　　　 MySQL索引背后的数据结构及算法原理

posted @ 2018-11-18 18:08 silence_cho 阅读(4386) 评论(0) 编辑收藏举报

刷新页面返回顶部

silence_cho

mysql数据库索引和引擎

公告