一个1年前的T-SQL问题

还记得年前的一个SQL问题,当时对SQL刚接触,因此绕开了它。用了别的办法。昨天看SQL突然想起了这个问题。百思不得其解,然后去SQL Server技术交流群,也请教了,大神高文佳,何志勇提示我因为先分组然后再链接。但由于小弟技术是在是太菜,因此没能弄出我想要的结果来。后来由于太晚的原因或者是问题太简单(当然大神们实在是很热情),大神们都睡觉了。今天还是在纠结这个问题的解决方法。

先给出测试用的初始化表和数据:

CREATE TABLE [dbo].tab_1(
	[Id] [int] NOT NULL,
	[SkillId] [int] NOT NULL
) ON [PRIMARY]

CREATE TABLE [dbo].tab_2(
	[Id] [int] NOT NULL,
	[SkillId] [int] NOT NULL
) ON [PRIMARY]

GO

insert into tab_1 values(1,1)
insert into tab_1 values(1,2)
insert into tab_1 values(2,1)
insert into tab_1 values(2,3)
insert into tab_1 values(2,6)

insert into tab_2 values(5,1)
insert into tab_2 values(5,2)
insert into tab_2 values(5,4)
insert into tab_2 values(7,1)
insert into tab_2 values(7,3)
insert into tab_2 values(7,6)

查询表数据如下:

 tab_1

tab_2

问题1:现在的问题是想查出这部分数据(语言表达能力不好,我就直接给图了^_^):

也就是每组根据Id分组后,取tab_1和tab_2有完全相同的SkillId分组项。

开始就一直思考如何用分组、联接来实现。后来发现有各种不同的问题(当然是我的问题),最终换了思路,将每个表根据主键分组(为了测试方便我没有设主键),然后使用合并列的方法来曲线实现了一下:

with cte1 as(
	select Id, stuff((select ','+ CONVERT(varchar,SkillId) from tab_1 t where t.Id=t1.Id  for xml path('')),1,1,'') as Skills from tab_1 t1
	group by Id
),
cte2 as(
	select Id, stuff((select ','+ CONVERT(varchar,SkillId) from tab_2 tt where tt.Id=tt1.Id for xml path('')),1,1,'') as Skills from tab_2 tt1
	group by Id
)select * from cte1 join cte2 on cte1.Skills=cte2.Skills

但是我想这个方法是不好的。因为如果此时我给表tab_1添加一列:

insert into tab_1 values(2,5)

问题2:我想取出这部分数据:

也就是每组根据Id分组后,判断tab_1的某个分组的SkillId是否完整包含tab_2的某个分组的SkillId。这个时候再用分组合并的办法就不管用了。

当然呢,大神们很快就发现了使用charindex来实现:

with cte1 as(
    select Id, stuff((select ','+ CONVERT(varchar,SkillId) from tab_1 t where t.Id=t1.Id  for xml path('')),1,1,'') as Skills from tab_1 t1
    group by Id
),
cte2 as(
    select Id, stuff((select ','+ CONVERT(varchar,SkillId) from tab_2 tt where tt.Id=tt1.Id for xml path('')),1,1,'') as Skills from tab_2 tt1
    group by Id
)select * from cte1 join cte2 on CHARINDEX(cte2.Skills,cte1.Skills)=1

以上只是用到了SQL Server的for xml path()列转行,stuff()字符串函数截取以及charindex()字符串函数来比较字符串。

另外根据@小飞虾、@小不正经提供的思路:

1.对2各表分别根据主键字段组内排序计算出每组的总数

2.对结果1的2个表根据关联字段SkillId进行表联接,并根据1中2个表的主键字段进行组内排序,计算出此结果集的每组的总数

3.将2得出的结果集进行条件运算。如果问题1的要求则用等号计算;如果是问题2的要求则用>=计算。T-SQL如下:

with cte1 as(
   select id,SkillId,count(1) over (partition by Id) as count1 from tab_1
),cte2 as(
   select id,SkillId,count(1) over (partition by Id) as count2 from tab_2
),cte3 as(
   select cte1.Id,cte1.Skillid,count1,cte2.Id as Id2,cte2.SkillId as SkillId2,cte2.count2,
   COUNT(1) over (partition by cte1.Id,cte2.Id) as count3
   from cte1  full join cte2
   on cte1.SkillId=cte2.SkillId
)select Id,SkillId,Id2,SkillId2 from cte3
where count1 >=count2 and count3 >=count2

那么有什么更多的好的办法没有呢?肯定是有的对吧。请各抒己见,在此肯求大伙儿热心指教。不胜感激!

 

posted @ 2015-06-17 10:29  自由的鱼  阅读(2620)  评论(30编辑  收藏  举报