python-study-42

索引介绍

一：为什么要有索引

索引是用来优化查询效率（速度）的

没有索引的话，对于大数据的表，就只能每次都遍历一遍，数据量越大，耗时越多
有索引的话，可以提升好几个数量级的速度

一般的应用系统，读写比例在10:1左右，而且插入操作和一般的更新操作很少出现性能问题，在生产环境中，我们遇到最多的，也是最容易出问题的，还是一些复杂的查询操作，因此对查询语句的优化显然是重中之重。说起加速查询，就不得不提到索引了。

二：什么是索引
索引在mysql中叫做key（键）

是存储引擎用于快速找到记录的一种数据结构

索引可以理解为字典中的目录部分
是以类似二叉树的形式组织的，一般2-4层

三：索引误区
索引多：提升了查询速度，但是磁盘IO会爆掉
索引少：影响查询速度，提升了应用性能
因此要具体分析

View Code

索引原理

一 索引原理

通过不断地缩小想要获取数据的范围来筛选出最终想要的结果，同时把随机的事件变成顺序的事件
索引的排列是从左到右越来越大的

二 磁盘IO与预读

磁盘读取数据靠的是机械运动
读数据时间=寻道时间+旋转延迟+传输时间=9ms
寻到时间：5ms
旋转延迟：4ms
传输时间：从内存到磁盘或从磁盘到内存，忽略不计

所以要尽量减少磁盘IO

预读：
考虑到磁盘IO是非常高昂的操作，计算机操作系统做了一些优化，当一次IO时，不光把当前磁盘地址的数据，而是把相邻的数据也都读取到内存缓冲区内，因为局部预读性原理告诉我们，当计算机访问一个地址的数据的时候，与其相邻的数据也会很快被访问到。每一次IO读取的数据我们称之为一页(page)。具体一页有多大数据跟操作系统有关，一般为4k或8k，也就是我们读取一页内的数据时候，实际上才发生了一次IO，这个理论对于索引的数据结构设计非常有帮助。

View Code

索引的数据结构



这种数据组织结构就是索引

b+树：

这种数据结构能够，每次查找数据时把磁盘IO次数控制在一个很小的数量级

b+树的查找IO；
如果是百万量级的数据：没有索引要有百万次的IO
有了索引只需要3次IO即可，由此可见索引的优势

创建索引注意事项：
1.索引字段要尽量的小
io次数取决于b+树的高度，索引字段越小，每个磁盘块的数据项就能存越多，高度就越低。

2.索引的最左匹配特性

View Code

聚集索引和辅助索引

聚集索引与辅助索引相同的是：不管是聚集索引还是辅助索引，其内部都是B+树的形式，即高度是平衡的，叶子结点存放着所有的数据。

聚集索引与辅助索引不同的是：叶子结点存放的是否是一整行的信息

由于实际的数据页只能按照一棵B+树进行排序，因此每张表只能拥有一个聚集索引

聚集索引能够在B+树索引的叶子节点上直接找到数据

辅助索引的叶子节点不包含行记录的全部数据。
叶子节点除了包含键值以外，每个叶子节点中的索引行中还包含一个书签该书签用来告诉InnoDB存储引擎去哪里可以找到与索引相对应的行数据


primary key：聚集索引
其他 key：辅助索引

View Code

索引功能

普通索引INDEX：加速查找

唯一索引：
    -主键索引PRIMARY KEY：加速查找+约束（不为空、不能重复）
    -唯一索引UNIQUE:加速查找+约束（不能重复）

联合索引：
    -PRIMARY KEY(id,name):联合主键索引
    -UNIQUE(id,name):联合唯一索引
    -INDEX(id,name):联合普通索引

View Code

创建和删除索引的语法

#方法一：创建表时
    　　CREATE TABLE 表名 (
                字段名1  数据类型 [完整性约束条件…],
                字段名2  数据类型 [完整性约束条件…],
                [UNIQUE | FULLTEXT | SPATIAL ]   INDEX | KEY
                [索引名]  (字段名[(长度)]  [ASC |DESC]) 
                );


#方法二：CREATE在已存在的表上创建索引
        CREATE  [UNIQUE | FULLTEXT | SPATIAL ]  INDEX  索引名 
                     ON 表名 (字段名[(长度)]  [ASC |DESC]) ;


#方法三：ALTER TABLE在已存在的表上创建索引
        ALTER TABLE 表名 ADD  [UNIQUE | FULLTEXT | SPATIAL ] INDEX
                             索引名 (字段名[(长度)]  [ASC |DESC]) ;
                             
#删除索引：DROP INDEX 索引名 ON 表名字;


#方式一
create table t1(
    id int,
    name char,
    age int,
    sex enum('male','female'),
    unique key uni_id(id),
    index ix_name(name) #index没有key
);


#方式二
create index ix_age on t1(age);

#方式三
alter table t1 add index ix_sex(sex);

View Code

总结

索引

http://www.cnblogs.com/linhaifeng/articles/7274563.html#top

索引：加速查询速度，索引不能优化所有的sql语句

读写比例：10:1
写一般没有性能上的问题
我们主要是优化查询速度

客户端---服务端
1 网络延迟问题
2 服务端磁盘到内存的问题
网络问题不是我们研究的问题
我们研究减少磁盘IO问题，就是索引问题

索引就是mysql中的key（primary key index key）
索引：存储引擎用于快速找到记录的一种数据结构

索引多：每次写都会改变一次索引，造成磁盘IO上升
索引少：影响查询性能，索引越多，查询越快
所以要找到平衡点

索引原理：不断缩小查找是数据的范围

索引理解为字典的目录

索引是二叉树的结构形式

pk：加速+约束
uk：加速+约束
index key：加速

ps：有索引的字段才可以加速

b+树

primary key：聚集索引
其他key：辅助索引

View Code

posted @ 2018-07-25 21:15 xujinjin 阅读(123) 评论(0) 编辑收藏举报

刷新页面返回顶部

python-study-42

公告