昨天一朋友问我一个问题,需要将一张表里指定的编号(2-4个),按照名称统计编号的数量,仅有一个编号数据的不显示。
模拟表结构如下:
CREATE TABLE TEMP
(
    ID        
INT IDENTITY(1,1),
    T_ID    
INT,
    T_NAME    
NVARCHAR(5)
)
插入一些数据:
INSERT TEMP    SELECT 1,'A'
UNION ALL    SELECT 2,'B'
UNION ALL    SELECT 3,'C'
UNION ALL    SELECT 4,'D'
UNION ALL    SELECT 1,'C'
UNION ALL    SELECT 4,'B'
UNION ALL    SELECT 4,'C'
UNION ALL    SELECT 2,'A'
实际应得到的数据为:
T_ID1       T_ID2       T_ID3       T_ID4       T_NAME
----------- ----------- ----------- ----------- ------
1           1           0           0           A
0           1           0           1           B
1           0           1           1           C
因为编号是给出的,那么得想办法得到符合条件的T_NAME,这样的话需要根据 T_ID和T_NAME分组数据然后将有多个编号的数据过滤出来,这里需要将结果集自连一下,这里使用SQL SERVER 2005 提供了一个新的语法 CTE(COMMON TABLE EXPRESSION)公共表表达式,不用创建临时表,并且可以进行JOIN操作,遗憾的是必须紧跟着使用,在后面的语句就不能用了.用CTE实现这个功能:
WITH _TEMP AS
(
    
SELECT T_ID,T_NAME FROM TEMP WHERE T_ID IN (1,2,3,4GROUP BY T_ID,T_NAME

SELECT DISTINCT _TEMP.T_NAME FROM _TEMP JOIN _TEMP TEMP_TEMP
    
ON _TEMP.T_NAME=TEMP_TEMP.T_NAME WHERE _TEMP.T_ID<>TEMP_TEMP.T_ID
查询的数据为:
T_NAME
------
A
B
C
这样符合条件的T_NAME数据就取出来了,现在定义一个变量,将这个数据组合起来作为条件去取出符合条件的数据:
DECLARE @NAMES NVARCHAR(20
SET @NAMES = '';
WITH _TEMP AS
(
    
SELECT T_ID,T_NAME FROM TEMP WHERE T_ID IN (1,2,3,4GROUP BY T_ID,T_NAME

SELECT @NAMES = @NAMES + '''' + _TEMP.T_NAME + ''',' FROM _TEMP JOIN _TEMP TEMP_TEMP
    
ON _TEMP.T_NAME=TEMP_TEMP.T_NAME WHERE _TEMP.T_ID<>TEMP_TEMP.T_ID
SET @NAMES = LEFT(@NAMES,LEN(@NAMES)-1)
EXEC('SELECT T_ID,T_NAME FROM TEMP WHERE T_ID IN (1,2,3,4) AND T_NAME IN ('+@NAMES+')')
--查询出的数据为:
T_ID        T_NAME
----------- ------
1           A
2           B
3           C
1           C
4           B
4           C
2           A
现在需要做的事情就是按T_NAME统计T_ID并实现行列转换,在SQL 2005之前的版本可能需要些CASE语块,如果列数不确定的话就更麻烦了,现在SQL 2005提供了 PIVOT 运算符来实现行列转换,完整的SQL语句:
DECLARE @NAMES NVARCHAR(20
SET @NAMES = '';
WITH _TEMP AS
(
    
SELECT T_ID,T_NAME FROM TEMP WHERE T_ID IN (1,2,3,4GROUP BY T_ID,T_NAME

SELECT @NAMES = @NAMES + '''' + _TEMP.T_NAME + ''',' FROM _TEMP JOIN _TEMP TEMP_TEMP
    
ON _TEMP.T_NAME=TEMP_TEMP.T_NAME WHERE _TEMP.T_ID<>TEMP_TEMP.T_ID
SET @NAMES = LEFT(@NAMES,LEN(@NAMES)-1)
DECLARE @EXEC_SQL VARCHAR(1000)
SET @EXEC_SQL =('SELECT [1][T_ID1],[2][T_ID2],[3][T_ID3],[4][T_ID4],T_NAME FROM
(SELECT T_ID,T_NAME FROM TEMP WHERE T_ID IN (1,2,3,4) AND T_NAME IN (
'+@NAMES+'))G
PIVOT
(
    COUNT(T_ID) 
    FOR T_ID IN ([1],[2],[3],[4])
)P
')
EXEC@EXEC_SQL)
因为符合条件的T_NAME不会很多,所以这里使用 IN 运算符,并用SQL 2005 的一些新特性实现要求。
另一种实现方法不使用CTE,使用表自连抓取数据然后再使用PIVOT 运算符来实现行列转换:
SELECT [1][T_ID1],[2][T_ID2],[3][T_ID3],[4][T_ID4],T_NAME FROM 
(
SELECT MAIN.T_ID,TEMP.T_NAME FROM TEMP MAIN JOIN TEMP ON MAIN.T_NAME=TEMP.T_NAME
WHERE MAIN.T_ID IN (1,2,3,4AND TEMP.T_ID IN (1,2,3,4AND MAIN.T_ID<>TEMP.T_ID
GROUP BY MAIN.ID,MAIN.T_ID,TEMP.T_NAME)G
PIVOT
(
    
COUNT(T_ID) 
    
FOR T_ID IN ([1],[2],[3],[4])
)P
发送过去后,在真实环境(一百二十多万条数据)执行了下,速度还是很快的。
posted on 2008-02-02 10:48  空空儿  阅读(4573)  评论(10编辑  收藏  举报