索引长度和区分度

建立索引的原则:

1:查询频繁

2:区分度高  

3:长度小  

4: 尽量能覆盖常用查询字段.


索引长度:
1: 索引越短, 重复度越高,区分度越小, 索引效果越不好
2: 索引越长, 重复度越低,区分度越高, 索引效果越好,但带来的影响也越大--索引文件越大,增删改变慢,并且影响查询速度.

所以, 要在  区分度 + 长度  两者上,取得一个平衡.


使用技巧:如果从左边截取区分度较低,可以考虑从右边截取

惯用手法: 截取不同长度,并测试其区分度

 

[sql] view plain copy
 
  1. <span style="font-size:18px;">select count(distinct left(word,6))/count(*) from dict;   
  2. +---------------------------------------+  
  3. count(distinct left(word,6))/count(*) |  
  4. +---------------------------------------+  
  5. |                                0.9992 |  
  6. +---------------------------------------+</span>  

 

截取word字段长度,从1开始截取,计算字符前缀没有重复的字符占全部数据的比例


对于一般的系统应用: 区别度能达到0.1,索引的性能就可以接受.

 

posted @ 2016-08-15 15:23  lpfuture  阅读(1392)  评论(0编辑  收藏  举报