not in 语句使程充崩溃

以前一直以为优化在百万级的表中才会有意义,这次的事件改变了我的看法

 

两张表 组织架构表(Organise 工资发放历史记录表 WagePerMonthHis

两张表通过 Organise.Item_id WagePerMonthHis.OrgIdS 进行关联

Organise(以下简称O)中大约有6000条记录11个字段 ,WagePerMonthHis(以下简称W)计有 125万条记录 25个字段

 

原程序中一段如下的语句

是查询所有不在W表的组织架构层级为2的记录

select OrgId as 公司编码,OrgName as 公司名称

from Organise

where OrgLev=2

and item_id not in

(select OrgidS from WagesPerMonthHis

where WagesYear='2010' and WagesMonth=

'01' Group by OrgidS,OrgNameS)

order by Orgid

 

语句执行要33秒之久,服务器的配置是比较高的:16核心4CPU,24G内存,且内存和CPU在执行时都没有出现瓶颈,开始以为是 (select OrgidS from WagesPerMonthHis

where WagesYear='2010' and WagesMonth=

'01' Group by OrgidS,OrgNameS)   这条语句执行缓慢所致,单独执行这条却发现执行速度很快,大约不到2秒就出来了,于是症结出来了,not in 这个全扫描关键词带来的性能下降.最直接的是导致页面失去响应,一个关键功能使用不了.

 

试了not exist语句,发现效果是一样的,并不象网上所说可以提高很多性能.

 

于是重新优化语句如下

select a.OrgId as 公司编码,a.OrgName as 公司名称,a.item_id

from Organise a

left outer join (select distinct b.OrgIdS from WagesPerMonthHis b

where WagesYear='2010' and WagesMonth='01') as b

on a.item_id = b.OrgidS

where a.OrgLev = 2

and b.OrgIdS is Null

order by 公司编码

 

改用左外连接(其实左连接也可以),整个语句执行速度为400ms, 33秒与400ms 我想是很多人没想到的.
posted @   george.hu  阅读(504)  评论(1编辑  收藏  举报
编辑推荐:
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
阅读排行:
· 周边上新:园子的第一款马克杯温暖上架
· Open-Sora 2.0 重磅开源!
· .NET周刊【3月第1期 2025-03-02】
· [AI/GPT/综述] AI Agent的设计模式综述
· 分享 3 个 .NET 开源的文件压缩处理库,助力快速实现文件压缩解压功能!
历史上的今天:
2010-12-16 失败的项目,反思
点击右上角即可分享
微信分享提示