数据库索引的使用
今天发现一个问题,问题大概是这种。查询interface的信息。在本地使用本地的数据库訪问没有问题。可是公布到server上以后訪问速度就特别的忙。须要5分钟左右才干返回数据。这肯定是无法让人接受的。刚開始以为是server性能的问题,为了验证就把server上的数据库备份到本地。发现本地的速度也立即慢了下来。究竟是什么问题的。看了一下查询interface的sql语句不禁吓了一跳:
select distinct a.id ,a.name ,a.interfacecode ,a.version ,a.synasyn ,a.frequence ,a.solutionmodelid ,a.owner ,a.createtime ,a.status ,a.description ,p.id as "project.id" ,p.name as "project.name" ,p.pcategory as "project.pcategory" ,r.name as "release.name" , r.id as "release.id" ,b.name as "middlewarename" ,l1.name as "sourcesystem" ,l2.name as "targetsystem" , f.name as "messageformat1" ,k.name as "messageformat2" ,g.name as "messagename1" ,l.name as "messagename2" ,m.id as "interfacemapid" ,m.category as category , c.bos as "bos1" ,h.bos as "bos2" ,sm.name as "solutionModelName" ,a.lastmodifytime as "lastModifiedAt" ,df.name as "scenario" ,a.iscurrent as "iscurrent" ,m.reviewstatus as "reviewStatus" ,m.reviewedby as "reviewedBy" ,m.reviewedat as "reviewedAt" ,m.trackleader FROM interfacemapping m LEFT JOIN project p ON m.projectid = p.id LEFT JOIN realse r ON p.realseid = r.id LEFT JOIN integrationinterface a ON m.interfaceid = a.id LEFT JOIN logicsystem b ON a.middleware = b.id LEFT JOIN interfacedetail c ON c.interfaceid = a.id AND UCASE(c.flowflag) = 'START' LEFT JOIN logicsystem d ON d.id = c.logicsystemid LEFT JOIN messageformat f ON f.id = c.messageformatid LEFT JOIN messagedic g ON g.id = c.messagename LEFT JOIN interfacedetail h ON h.interfaceid = a.id AND UCASE(h.flowflag) = 'END' LEFT JOIN logicsystem j ON j.id = h.middleware LEFT JOIN messageformat k ON k.id = h.messageformatid LEFT JOIN messagedic l ON l.id = h.messagename LEFT JOIN interfacedetail u ON u.interfaceid = a.id AND UCASE(u.flowflag) = 'MID' LEFT JOIN messageformat n ON n.id = u.messageformatid LEFT JOIN messagedic z on z.id = u.messagename LEFT JOIN logicsystem l1 ON l1.id = a.sourcesystemid LEFT JOIN logicsystem l2 ON l2.id = a.targetsystemid lEFT JOIN solutionmodel sm ON sm.id = a.solutionmodelid LEFT JOIN DATAFLOWINFO df ON df.ID = a.SCENARIOID
我想你也一定被吓到了。
可是这也仅仅是当中的一部分,还有动态的sql我没有贴出来。
是由于一堆表连接所以速度有影响吗?决定下手调一下这个sql语句,使用的方法就是逐个的连接表。
当我连接到LEFT JOINinterfacedetail c 时,查询速度居然是20秒。
就是这一个表导致的表之间连接的速度慢的吗?
然后我就開始分析为什么原来本地的数据库时数据快。我发现原来本地的库中interfacedetail中是没有数据的。而如今的库中表中有8000条数据,这是导致查询慢的原因吗?8000条以上的数据就不适合做连接查询了吗?
可是我突然想到原来在db2中一样的数据,为什么查询就挺快的。首先我是验证了。当前mysql中每个表中的数据和db2中的数据全然同样。
结果发现全然同样,可是db2中运行的速度是0.4秒,全然是能够接受的。问题又来了。这就是企业级数据库与普通数据库的差别?
但这个结果还是不能让我相信的。我就查了其它的资料。发现有人说索引能够提高表之间连接的速度。结果我还是真的发现db2中有interfacedetail.interfaceid的索引。
我在mysql中增加相同的索引:
CREATE INDEX T_PI_VLO_NAAE_IDX1 ONinterfacedetail (interfaceid);
然后再直接上面的语句。直接速度立即到了0.5秒以内。。问题算是攻克了。
可是到底索引为啥又这么大的作用。索引是什么呢?
为什么要创建索引呢?这是由于。创建索引能够大大提高系统的性能。
第一,通过创建唯一性索引,能够保证数据库表中每一行数据的唯一性。
第二,能够大大加快数据的检索速度。这也是创建索引的最基本的原因。
第三,能够加速表和表之间的连接,特别是在实现数据的參考完整性方面特别有意义。
第四。在使用分组和排序子句进行数据检索时。相同能够显著降低查询中分组和排序的时间。
第五,通过使用索引,能够在查询的过程中。使用优化隐藏器,提高系统的性能。
或许会有人要问:添加索引有如此多的长处,为什么不正确表中的每个列创建一个索引呢?这样的想法固然有其合理性。然而也有其片面性。尽管,索引有很多长处,可是,为表中的每个列都添加索引,是很不明智的。这是由于。添加索引也有很多不利的一个方面。
第一,创建索引和维护索引要耗费时间,这样的时间随着数据量的添加而添加。
第二,除了数据表占数据空间之外,每个索引还要占一定的物理空间。假设要建立聚簇索引,那么须要的空间就会更大。
第三,当对表中的数据进行添加、删除和改动的时候,索引也要动态的维护,这样就减少了数据的维护速度。
索引是建立在数据库表中的某些列的上面。因此,在创建索引的时候。应该细致考虑在哪些列上能够创建索引,在哪些列上不能创建索引。一般来说。应该在这些列上创建索引。比如:在常常须要搜索的列上。能够加快搜索的速度;在作为主键的列上,强制该列的唯一性和组织表中数据的排列结构;在常常常使用在连接的列上,这些列主要是一些外键。能够加快连接的速度;在常常须要依据范围进行搜索的列上创建索引,由于索引已经排序,其指定的范围是连续的;在常常须要排序的列上创建索引,由于索引已经排序。这样查询能够利用索引的排序。加快排序查询时间。在常常使用在WHERE子句中的列上面创建索引,加快条件的推断速度。
相同。对于有些列不应该创建索引。一般来说,不应该创建索引的的这些列具有下列特点:第一,对于那些在查询中非常少使用或者參考的列不应该创建索引。
这是由于,既然这些列非常少使用到,因此有索引或者无索引。并不能提高查询速度。
相反。由于添加了索引,反而减少了系统的维护速度和增大了空间需求。第二。对于那些仅仅有非常少数据值的列也不应该添加索引。
这是由于,由于这些列的取值非常少,比如人事表的性别列,在查询的结果中,结果集的数据行占了表中数据行的非常大比例,即须要在表中搜索的数据行的比例非常大。添加索引,并不能明显加快检索速度。第三,对于那些定义为text,image和bit数据类型的列不应该添加索引。这是由于。这些列的数据量要么相当大。要么取值非常少。
第四。当改动性能远远大于检索性能时。不应该创建索引。这是由于。改动性能和检索性能是互相矛盾的。
当添加索引时,会提高检索性能。可是会减少改动性能。
当减少索引时。会提高改动性能。减少检索性能。因此。当改动性能远远大于检索性能时,不应该创建索引。
好了。
问题也解决完了,也学到了不少的东西,这次的索引课认识深刻了。