分拆函数性能优化

use Tempdb

if OBJECT_ID ( 'F_Str1' ) is not null

drop function F_Str1

此函数缺点，字符长度越长性能越低。

create FUNCTION dbo . F_Str1 (

@Str NVARCHAR ( 4000 ), -- 需要处理的字符串

@Condition nvarchar ( 1000 ) -- 保留字符串如 :N'%[0-9a-zA-Z]%', 注意这里需要有 []

)

RETURNS NVARCHAR ( 4000 )

BEGIN

if charindex ( '[^' , @Condition )=0

set @Condition = STUFF ( @Condition , charindex ( '[' , @Condition )+ 1 , 0 , '^' ) --这一段是为了与后面函数的条件统一

declare @i int

set @i = PATINDEX ( @Condition , @Str )

WHILE @i > 0

SELECT @Str = STUFF ( @Str , @i , 1 , '' ), @i = PATINDEX ( @Condition , @Str )

RETURN @Str

END

IF OBJECT_ID ( 'F_Str2' ) IS NOT NULL

DROP FUNCTION F_Str2

CREATE FUNCTION dbo . F_Str2 (

@Str NVARCHAR ( 4000 ), -- 需要处理的字符串

@Condition nvarchar ( 1000 ) -- 保留字符串如 :N'%[0-9a-zA-Z]%', 注意这里需要有 []

)

RETURNS NVARCHAR ( 4000 )

BEGIN

DECLARE @s NVARCHAR ( 4000 ), @s2 NVARCHAR ( 4000 )

, @s3 NVARCHAR ( 2 ), @s4 NVARCHAR ( 2 )

, @a NVARCHAR ( 4000 ), @b NVARCHAR ( 4000 )

, @i INT , @j INT , @k INT

SELECT @s = '' , @s2 = '' , @i = 1 , @k = len ( @Str ), @j = CEILING ( @k * 1.0 / 2 )

SELECT @a =LEFT( @Str , @j ), @b =RIGHT( @Str , @k - @j )

WHILE @i <= @j

begin

SELECT @s3 = SUBSTRING ( @a , @i , 1 ), @s4 = SUBSTRING ( @b , @i , 1 )

if @s3 LIKE @Condition

SET @s = @s + @s3

if @s4 LIKE @Condition

SET @s2 = @s2 + @s4

SET @i = @i + 1

end

RETURN @s + @s2

END

--- 以保留数字和字母（字符长度为 4000 ）为例，测试结果：

use tempdb

select @@VERSION--测试环境

IF OBJECT_ID ( 'Tempdb..#T' ) IS NOT NULL

DROP TABLE #T

CREATE TABLE #T( Col NVARCHAR ( 4000))

DECLARE @s NVARCHAR ( 4000)

SET @s= REPLICATE ( N' 中 A 国 B' , 2000) -- 改動一下測試數據

INSERT #T SELECT @s

go 10 --10 条记录

-- 清空缓存计划

DBCC FREEPROCCACHE -- 从过程缓存中删除所有元素

DBCC DROPCLEANBUFFERS -- 从缓冲池中删除所有清除缓冲区。

DBCC FREESYSTEMCACHE( 'Tempdb' ) -- 从所有缓存中释放所有未使用的缓存条目

-- 多执行几次取最小值

--F_str1 函数

DECLARE @dt DATETIME = GETDATE ()

SELECT LEN ( dbo. F_str1( Col, N'%[0-9a-zA-Z]%' )) AS [ 檢查長度 ], dbo. F_str1( Col, N'%[0-9a-zA-Z]%' )

FROM #T

SELECT DATEDIFF ( ms, @dt, GETDATE ())

-- 时间为

21466 ms

--F_str2 函数

DECLARE @dt DATETIME = GETDATE ()

SELECT LEN ( dbo. F_str2( Col, N'%[0-9a-zA-Z]%' )) AS [ 檢查長度 ], dbo. F_str2( Col, N'%[0-9a-zA-Z]%' )

FROM #T

SELECT DATEDIFF ( ms, @dt, GETDATE ())

496 ms -- 效率提高了44倍多

-- 当字符串长度越大时，效率提高越明显。

以下针对性过滤写法，利用指定排序规则，过滤以上测试数据的中文字符

以下以排序 Latin1_General_CI_AS 为例，支持数字与字符不支持繁体和简体字 , 当不支持时会显示为 ”?” ，利用这一特性可以这样写：

if OBJECT_ID ( 'F_Str3' ) is not null

drop function F_Str3

create FUNCTION dbo. F_Str3(

@Str NVARCHAR ( 4000) --

)

RETURNS NVARCHAR ( 4000)

BEGIN

set @Str= REPLACE ( cast ( @Str as varchar ( 8000)) COLLATE Latin1_General_CI_AS, '?' , '' ) -- 取巧方法

RETURN @Str

END

-- 测试结果

--F_str3 函数

DECLARE @dt DATETIME = GETDATE ()

SELECT LEN ( dbo. F_str3( Col)) AS [ 檢查長度 ], dbo. F_str3( Col) FROM #T

SELECT DATEDIFF ( ms, @dt, GETDATE ())

266 ms

闹剧总结

posted on 2011-03-22 23:33 中國風阅读(147) 评论(0) 编辑收藏举报