SUMSEN

Oracle&Sql爱好者,用友NC管理员

  博客园 :: 首页 :: 博问 :: 闪存 :: 新随笔 :: 联系 :: 订阅 订阅 :: 管理 ::

http://www.asplearn.net/Wangluobiancheng/Oracle/80015.html

由于迁移的表有几千万数据,但是有中文的记录集很少,能否找出有中文内容的记录数。首先采用检测每个字节ASCII的方式,这样的话需要写一个自定义函数,然后SQL中调用得到结果。但是感觉这个方法估计很耗时,毕竟每个字符都要比较,所以没有去实现。Oracle有一个编码转换的函数叫Convert,如果一个字符串编码转换前后不一样就表示字符串里面含有非ASCII字符,这样就得到结果。最后写出来测试了一下,确实可行,5500万记录10秒钟就扫描结束。以下是测试用例: 

SQL> select * 
  2    from (select ’abcd’ c1 from dual 
  3          union all 
  4          select ’ab测试cd’ c1 from dual) 
  5   where c1 <> CONVERT(c1, ’US7ASCII’, ’ZHS16GBK’); 
  
C1 
-------- 
ab测试cd 

CONVERT函数说明: 

CONVERT(inputstring,dest_charset,source_charset) 

inputstring:要转换的字符串 

dest_charset:目标字符集 

source_charset:原字符集 

这只是一个小技巧,也许有一天你也有这样的需求,或许能派上用场。

posted on 2012-05-30 08:59  sumsen  阅读(655)  评论(0编辑  收藏  举报