讲解SQL 2000的Collection排序规则（2）[转]

三.排序规则的应用：

SQL Server提供了大量的WINDOWS和SQLSERVER专用的排序规则，但它的应用往往被开发人员所忽略。其实它在实践中大有用处。

例1:让表NAME列的内容按拼音排序：

create  table  #t(id  int,name  varchar(20))
            insert  #t  select  1,'中'
            union  all  select  2,'国'
            union  all  select  3,'人'
            union  all  select  4,'阿'
            select  *  from  #t  order  by  name  collate  Chinese_PRC_CS_AS_KS_WS
            drop  table  #t
            /*结果：
            id                    name
            -----------  --------------------
            4                      阿
            2                      国
            3                      人
            1                      中
            */

例2：让表NAME列的内容按姓氏笔划排序：

create table #t(id int,name varchar(20))

insert  #t  select  1,'三'
            union  all  select  2,'乙'
            union  all  select  3,'二'
            union  all  select  4,'一'
            union  all  select  5,'十'
            select  *  from  #t  order  by  name  collate  Chinese_PRC_Stroke_CS_AS_KS_WS
            drop  table  #t

/*结果：

id                    name
            -----------  --------------------
            4                      一
            2                      乙
            3                      二
            5                      十
            1                      三
            */

四.在实践中排序规则应用的扩展

SQL Server汉字排序规则可以按拼音、笔划等排序，那么我们如何利用这种功能来处理汉字的一些难题呢？我现在举个例子：　用排序规则的特性计算汉字笔划

要计算汉字笔划，我们得先做准备工作，我们知道，WINDOWS多国汉字，UNICODE目前收录汉字共20902个。简体GBK码汉字UNICODE值从19968开始。

首先，我们先用SQLSERVER方法得到所有汉字，不用字典，我们简单利用SQL语句就可以得到：

select  top  20902  code=identity(int,19968,1)  into  #t  from  syscolumns  a,syscolumns  b

再用以下语句，我们就得到所有汉字，它是按UNICODE值排序的：

select  code,nchar(code)  as  CNWord  from  #t
            然后，我们用Select语句，让它按笔划排序。
            select  code,nchar(code)  as  CNWord
            from  #t
            order  by  nchar(code)  collate  Chinese_PRC_Stroke_CS_AS_KS_WS,code

结果：

code                CNWord
            -----------  ------
            19968              一
            20008              丨
            20022              丶
            20031              丿
            20032              乀
            20033              乁
            20057              乙
            20058              乚
            20059              乛
            20101              亅
            19969              丁
            ..........

从上面的结果，我们可以清楚的看到，一笔的汉字，code是从19968到20101，从小到大排，但到了二笔汉字的第一个字“丁”，CODE为19969，就不按顺序而重新开始了。有了这结果，我们就可以轻松的用SQL语句得到每种笔划汉字归类的第一个或最后一个汉字。

下面用语句得到最后一个汉字：

create  table  #t1(id  int  identity,code  int,cnword  nvarchar(2))
            insert  #t1(code,cnword)
            select  code,nchar(code)  as  CNWord    from  #t
            order  by  nchar(code)  collate  Chinese_PRC_Stroke_CS_AS_KS_WS,code
            select  A.cnword
            from  #t1  A
            left  join  #t1  B  on  A.id=B.id-1  and  A.code<B.code
            where  B.code  is  null
            order  by  A.id

得到36个汉字，每个汉字都是每种笔划数按Chinese_PRC_Stroke_CS_AS_KS_WS排序规则排序后的最后一个汉字：

亅阝马风龙齐龟齿鸩龀龛龂龆龈龊龍龠龎龐龑龡龢龝齹龣龥齈龞麷鸞麣龖龗齾齉龘

上面可以看出：“亅”是所有一笔汉字排序后的最后一个字，“阝”是所有二笔汉字排序后的最后一个字......等等。

但同时也发现，从第33个汉字“龗(33笔)”后面的笔划有些乱，不正确。但没关系，比“龗”笔划多的只有四个汉字，我们手工加上：齾35笔，齉36笔，靐39笔，龘64笔

建汉字笔划表（TAB_HZBH）：

create  table  tab_hzbh(id  int  identity,cnword  nchar(1))
            --先插入前33个汉字
            insert  tab_hzbh
            select  top  33  A.cnword
            from  #t1  A
            left  join  #t1  B  on  A.id=B.id-1  and  A.code<B.code
            where  B.code  is  null
            order  by  A.id
            --再加最后四个汉字
            set  identity_insert  tab_hzbh  on
            go
            insert  tab_hzbh(id,cnword)
            　　　　　select  35,N'齾'
            union  all  select  36,N'齉'
            union  all  select  39,N'靐'
            union  all  select  64,N'龘'
            go
            set  identity_insert  tab_hzbh  off
            go

本文出处:http://tech.ccidnet.com/art/1106/20080311/1386735_2.html

posted on 2008-06-24 18:18 投石问路阅读(346) 评论(0) 编辑收藏举报

刷新页面返回顶部

思想决定人生，态度改变一切

公告