关于SQL中查找字符串的总结 PATINDEX CHARINDEX 返回字符串中第N次出现指定字符串位置
假如你寫過很多程序,你可能偶爾會碰到要確定字符或字符竄串否包含在一段文字中,在這篇文章中,我將討論使用CHARINDEX和PATINDEX函數來搜索文字列和字符串。我將告訴你這兩個函數是如何運轉的,解釋他們的區別。同時提供一些例子,通過這些例子,你可以可以考慮使用這兩個函數來解決很多不同的字符搜索的問題。
CHARINDEX和PATINDEX函數常常用來在一段字符中搜索字符或者字符串。如果被搜索的字符中包含有要搜索的字符,那麼這兩個函數返回一個非零的整數,這個整數是要搜索的字符在被搜索的字符中的開始位數。PATINDEX函數支持使用通配符來進行搜索,然而CHARINDEX不支持通佩符。接下來,我們逐個分析這兩個函數。
or CHARINDEX('Road',Address)> 1
如何使用PATINDEX函數
PATINDEX函數返回字符或者字符串在另一個字符串或者表達式中的起始位置,PATINDEX函數支持搜索字符串中使用通配符,這使PATINDEX函數對於變化的搜索字符串很有價值。PATINDEX函數的命令如下:
- PATINDEX ( '%pattern%' , expression )
Pattern是你要搜索的字符串,expression是被搜索的字符串。一般情況下expression是一個表中的一個字段,pattern的前後需要用「%」標記,除非你搜索的字符串在被收縮的字符串的最前面或者最後面。
和CHARINDEX函數一樣,PATINDEX函數返回搜索字符串在被搜索字符串中的起始位置。假如有這樣一個PATINDEX函數:
- PATINDEX('%BC%','ABCD')
這個PATINDEX函數返回的結果是2,這和CHARINDEX函數一樣。這裡的%標記告訴PATINDEX函數去找字符串「BC」,不管被搜索的字符串中在「BC」的前後有多少字符!
假如你想知道被搜索字符串是否由特定的字符串開始,你可以省去前面的%標記。PATINDED函數就要這樣寫:
- PATINDEX('AB%','ABCD')
這個命令執行的結果返回1,表示搜索的字符串「AB」在被搜索的字符串中「ABCD」被找到。
使用通配符可以編輯比我以上舉得簡單例子複雜得多的搜索字符串。假如說你要確定一個字符串是否包含字母A和Z,還有任何數字,這個PARINDEX函數命令可能像這樣:
- PATINDEX('%[A,Z,0-9]%[A,Z,0-9]%[A,Z,0-9]%','XYZABC123')
注意在上面這個例子中的搜索字符部分使用了很多的通陪符。察看SQL Server聯機叢書可以獲得更多關於通佩符的資料。接下來,我們用兩個例子來看PATINDEX和Select怎麼聯合起來使用。
假設你想要找出Northwind.dbo.Categories表中Description字段中是包含單詞「Bread」或「bread」的所有記錄,那麼選擇語句就可能是這樣:
- Select Description from Northwind.dbo.Categories
- Where patindex('%[b,B]read%',description) > 0
這裡我用通配符來確定大寫和小寫的「b」。我在Notthwind資料庫中執行這個腳本後,得到下面的結果:
- Description
- --------------------------------------------------------
- Desserts, candies, and sweet breads
- Breads, crackers, pasta, and cereal
這是再用另外一個額外的通配符來查找一些記錄的例子。這個例子是如何選出上面的查詢結果中,Description字段的第二子字母不是「e」的紀錄。
- select Description from Northwind.dbo.Categories
- where patindex('%[b,B]read%',description) > 0
- and patindex('_[^e]%',description) = 1
通過在條件語句中增加一個使用^通配符的PATINDEX函數,我們可以過濾掉「Dessert, candies, and sweet breads」這條記錄。上面的查詢結果只有一條記錄。
- Description
- --------------------------------------------------------
- Breads, crackers, pasta, and cereal
總結
你現在可以發現CHARINDEX和PATINDEX搜索字符串時的區別了吧。PATINDEX函數支持使用通配符,可以用在很多有變化的查找中。而CHARINDEX不可以。根據你自己不同的情況,這兩個函數對你在SQL Server中的字符串的搜索、控制、分析很有幫助。
****************************************************
charindex代替like並非"更快更全面"
首先:先明確掉全面這個問題,想like百分號很簡單,幫助文檔裡面就有
ms-help://MS.SQLCC.v9/MS.SQLSVR.v9.zh-CHS/tsqlref9/html/581fb289-29f9-412b-869c-18d33a9e93d5.htm
轉義百分號類似下面方法:
- select * from
- (select 'a%b'as s unionselect 'ab' )t
- where s like'%\%%' escape'\' ;
反而,like可以實現比charindex更複雜的通配功能,比如partindex函數才支持的方括號
- select * from (select'amm_99' as sunion select'happyflystone' ) t
- where s like'%[0-9]%'
然後:說一下是否更快,這個需要有測試資料,不是我相信快就快的,sql優化結果誰都無法預料。我在windows2008+sqlserver2005中的測試結果是沒有索引一樣快,有索引like快。
特別強調一下雖然是%%的like,索引還是起作用的。
測試資料如下:
- use tempdb
- go
- if (object_id ('t_test' )> 0 )droptable t_test
- go
- create table t_test (f1varchar (100 ), f2 varchar (100 ), f3varchar (100 ))
- go
- insert into t_testselect newid (), newid (), newid ()
- go 1000
- create index i_teston t_test (f1 )
- go
我們看兩組sql語句的查詢計劃
第一組是:
- select * from t_testwhere f1 like'%abc%'
- select * from t_testwhere charindex ('abc' , f1 )> 0
結果如下:
很明显是like因为有索引扫描(rid是行标志符)而速度快于charindex,这里我们需要理解表扫描,索引扫描和索引查找的区别。为了说明这个问题,我们再看一下 like 'abc%'和charindex('abc',f1)=1的区别。
如果你測試一下,就會知道,charindex('abc',f1)=1和charindex('abc',f1)>0的效率是一樣的。這樣我們就能看出來,索引查找要比索引掃瞄快,索引掃瞄要比表掃瞄快。大概解釋一下我個人的理解,索引的存儲方式是一個特定資料結構的樹,查找可以被優化,不必遍歷整個樹的所有節點所以最快,而索引掃瞄需要遍歷所有樹的節點所以稍慢但仍然要比表掃瞄快。
SUBSTRING substring()
函数功效:
例子:
B.截取从字符串右边开始N个字符(例如取字符www.163.com)
|
C.截取字符串中任意位置及长度(例如取字符www)
Declare @S1 varchar(100) Select @S1='http://www.163.com' Select SUBSTRING(@S1,8,3) ------------------------------------ 显示结果: www.163.com |
以上例子皆是已知截取位置及长度,下面介绍未知位置的例子
2.截取未知位置的函数
A.截取指定字符串后的字符串(例如截取http://后面的字符串)
方法一:
Declare @S1 varchar(100) Select @S1='http://www.163.com' Select Substring(@S1,CHARINDEX('www',@S1)+1,Len(@S1)) /*此处也可以这样写:Select Substring(@S1,CHARINDEX('//',@S1)+2,Len(@S1))*/ ------------------------------------ |
需要注意:CHARINDEX函数搜索字符串时,不区分大小写,因此CHARINDEX('www',@S1)也可以写成CHARINDEX('WWW',@S1)
方法二:(与方法一类似)
Declare @S1 varchar(100) Select @S1='http://www.163.com' Select Substring(@S1,PATINDEX('%www%',@S1)+1,Len(@S1)) --此处也可以这样写:Select Substring(@S1,PATINDEX('%//%',@S1)+2,Len(@S1)) ------------------------------------ 显示结果: www.163.com |
函数PATINDEX与CHARINDEX区别在于:前者可以参数一些参数,增加查询的功能
方法三:
Declare @S1 varchar(100) Select @S1='http://www.163.com' Select REPLACE(@S1,'http://','') ------------------------------------ 显示结果: www.163.com |
利用字符替换函数REPLACE,将除需要显示字符串外的字符替换为空
方法四:
Declare @S1 varchar(100) Select @S1='http://www.163.com' Select STUFF(@S1,CHARINDEX('http://',@S1),Len('http://'),'') ------------------------------------ 显示结果: www.163.com |
函数STUFF与REPLACE区别在于:前者可以指定替换范围,而后者则是全部范围内替换
B.截取指定字符后的字符串(例如截取C:\Windows\test.txt中文件名)
与A不同的是,当搜索对象不是一个时,利用上面的方法只能搜索到第一个位置
方法一:
Declare @S1 varchar(100) |
利用函数REVERSE获取需要截取的字符串长度
substr()
例子:
private void DDL_AreaBind()
{
conn = new SqlConnection(ConfigurationManager.ConnectionStrings["strcon"].ConnectionString);
string str = "0000";
cmd = new SqlCommand("select AreaID,Name=ltrim(Name) from Area where right(AreaID,4) ='" + str + "'", conn);
SqlDataAdapter sda = new SqlDataAdapter(cmd);
sda.Fill(ds, "area");
this.ddl_area.DataSource = ds.Tables["area"].DefaultView;
this.ddl_area.DataTextField = "Name";
this.ddl_area.DataValueField = "AreaID";
this.ddl_area.DataBind();
cmd = new SqlCommand("select * from Area ", conn);
cmd.CommandType = CommandType.Text;
SqlDataAdapter adapter = new SqlDataAdapter(cmd);
adapter.Fill(ds, "city");
this.ddl_city.DataSource = ds.Tables["city"].DefaultView;
this.ddl_city.DataTextField = "Name";
this.ddl_city.DataValueField = "AreaID";
this.ddl_city.DataBind();
}
protected void ddl_area_SelectedIndexChanged(object sender, EventArgs e)
{
conn = new SqlConnection(ConfigurationManager.ConnectionStrings["strcon"].ConnectionString);
this.ddl_city.Enabled = true;
string str1="0000";
cmd = new SqlCommand("select AreaID,Name from Area where substring(AreaID,1,2)='" + this.ddl_area.SelectedValue.Substring(0,2) + "' AND substring(AreaID,3,4) <> '0000' AND substring(AreaID,5,2)='00' ", conn);
cmd.CommandType = CommandType.Text;
SqlDataAdapter adapter = new SqlDataAdapter(cmd);
DataSet ds = new DataSet();
adapter.Fill(ds, "city");
this.ddl_city.DataSource = ds.Tables["city"].DefaultView;
this.ddl_city.DataTextField = "Name";
this.ddl_city.DataValueField = "AreaID";
this.ddl_city.DataBind();
}
PS:
最近项目中用到比较少见的SQL语句,分享一下:
查询祖先节点
select * from 目录表_数据库 where ID<>-1 and datatype<>1 and datatype<>2 connect by prior FATHERID=ID start with ID=28 order by 目录级别,ID
查询子孙节点:
select * from 目录表_数据库 where ID<>-1 and datatype<>1 and datatype<>2 connect by prior ID=FATHERID start with ID=28 order by 目录级别,ID
- create function fn_find(@find varchar(8000), @str varchar(8000), @n smallint)
- returns int
- as
- begin
- if @n < 1 return (0)
- declare @start smallint, @count smallint, @index smallint, @len smallint
- set @index = charindex(@find, @str)
- if @index = 0 return (0)
- else select @count = 1, @len = len(@find)
- while @index > 0 and @count < @n
- begin
- set @start = @index + @len
- select @index = charindex(@find, @str, @start), @count = @count + 1
- end
- if @count < @n set @index = 0
- return (@index)
- end
- go
- declare @str varchar(100)
- set @str='A,B,C,D,A,B,C,D,C,D,B,A,C,E'
- select dbo.fn_find('A',@str,1) as one, dbo.fn_find('A',@str,2) as two, dbo.fn_find('A',@str,3) as three, dbo.fn_find('A',@str,4) as four
- /*
- one two three four
- ----------- ----------- ----------- -----------
- 1 9 23 0
- */
create function fn_find(@find varchar(8000), @str varchar(8000), @n smallint) returns int as begin if @n < 1 return (0) declare @start smallint, @count smallint, @index smallint, @len smallint set @index = charindex(@find, @str) if @index = 0 return (0) else select @count = 1, @len = len(@find) while @index > 0 and @count < @n begin set @start = @index + @len select @index = charindex(@find, @str, @start), @count = @count + 1 end if @count < @n set @index = 0 return (@index) end go declare @str varchar(100) set @str='A,B,C,D,A,B,C,D,C,D,B,A,C,E' select dbo.fn_find('A',@str,1) as one, dbo.fn_find('A',@str,2) as two, dbo.fn_find('A',@str,3) as three, dbo.fn_find('A',@str,4) as four /* one two three four ----------- ----------- ----------- ----------- 1 9 23 0 */