数据库sql语句的exists和in的区别

性能变化的关键：

#1 执行的先后顺序

谁是驱动表，谁先执行查询，谁后执行查询

#2 执行过程

exists的优点是：只要存在就返回了，这样的话很有可能不需要扫描整个表。

in需要扫描完整个表，并返回结果。

所以，在字表比较小的情况下，扫描全表和部分表基本没有差别；但在大表情况下，exists就会有优势。

看这两个语句：

--子查询会执行完全关联，并返回所有符合条件的city_id

select * from areas where id in (select city_id from deals where deals.city_id = areas.id);

--子查询的关联其实是一样的，但子查询只要查到一个结果，就返回了，所以效率还是比较高些的

select * from areas where exists (select null from deals where deals.city_id = areas.id);

#3 字表查询的结果

exists判断子查询的结果是不是存在，但查到什么结果，什么字段，并不关心；

in 需要子查询查得的结果给主查询使用

对于in和exists的性能区别:
如果子查询得出的结果集记录较少，主查询中的表较大且又有索引时应该用in,反之如果外层的主查询记录较少，子查询中的表大，又有索引时使用exists。
其实我们区分in和exists主要是造成了驱动顺序的改变（这是性能变化的关键），如果是exists，那么以外层表为驱动表，先被访问，

如果是IN，那么先执行子查询，所以我们会以驱动表的快速返回为目标，那么就会考虑到索引及结果集的关系了

另外IN时不对NULL进行处理。

注意:NOT EXISTS与 NOT IN不能完全互相替换，看具体的需求。如果选择的列可以为空，则不能被替换。

对于not in和 not exists的性能区别：
not in只有当子查询中，select 关键字后的字段有not null约束或者有这种暗示时用not in,另外如果主查询中表大，子查询中的表小但是记录多，则应当使用not in,并使用anti hash join.
如果主查询表中记录少，子查询表中记录多，并有索引，可以使用not exists,另外not in最好也可以用/*+ HASH_AJ */或者外连接+is null
NOT IN在基于成本的应用中较好

posted @ 2017-12-01 09:55 考虑突破阅读(771) 评论(0) 收藏举报

刷新页面返回顶部

考虑突破

数据库sql语句的exists和in的区别

公告