oracle正则表达式

 

1. 正则表达式规范

(1).匹配字符

字符类 匹配的字符 举 例
\d 从0-9的任一数字 \d\d 匹配 72, 但不匹配 aa 或 7a
\D 任一非数字字符 \D\D\D 匹配 abc, 但不匹配 123
\w 任一单词字符,包括A-Z,a-z,0-9和下划线 \w\w\w\w 匹配 Ab-2 ,但不匹配∑ £$%* 或 Ab_@
\W 任一非单词字符 \W 匹配@,但不匹配 a
\s 任一空白字符,包括制表符,换行符,回车符,换页符和垂直制表符 匹配在 HTML,XML 和其他标准定义中的所有传统空白字符
\S 任一非空白字符 空白字符以外的任意字符,如A%&g3;等
. 任一字符 匹配除换行符以外的任意字符除非设置了 MultiLine 先项
[…] 括号中的任一字符 [abc] 将匹配一个单字符 ,a,b 或 c.
[a-z] 将匹配从 a 到 z 的任一字符
[^…] 不在括号中的任一字符 [^abc] 将匹配一个 a 、 b 、 c 之外的单字符 , 可以 a,b 或 A 、 B 、 C
[a-z] 将匹配不属于 a-z 的任一字符 , 但可以匹配所有的大写字母

 

(2).重复字符

重复字符 含 义 举 例
{n} 匹配前面的字符 n 次 x{2}匹配xx,但不匹配x或xxx
{n,} 匹配前面的字符至少 n 次 x{2}匹配2个或更多的x,如xxx,xxx..
{n,m} 匹配前面的字符至少 n 次 , 至多 m 次。如果 n 为 ,此参数为可选参数 x{2,4}匹配xx,xxx,xxxx,但不匹配xxxxx
? 匹配前面的字符 次或 1 次,实质上也是可选的 x?匹配x或零个x
+ 匹配前面的字符 次或多次 x+匹配x或xx或大于0的任意多个x
* 匹配前面的字符 次或更多次 x*匹配0,1或更多个x

 

(3).定位字符

定位字符 描 述
^ 随后的模式必须位于字符串的开始位置,如果是一个多行字符串,则必须位于行首。对于多行文本(包含回车符的一个字符串)来说,需要设置多行标志
$ 前面的模式必须位于字符串的未端,如果是一个多行字符串,必须位于行尾
\A 前面的模式必须位于字符串的开始位置,忽略多行标志
\z 前面的模式必须位于字符串的未端,忽略多行标志
\Z 前面的模式必须位于字符串的未端,或者位于一个换行符前
\b 匹配一个单词边界,也就是一个单词字符和非单词字符中间的点。要记住一个单词字符是 [a-zA-Z0-9] 中的一个字符。位于一个单词的词首
\B 匹配一个非单词字符边界位置,不是一个单词的词首

 

(4).分组字符

分组字符 定 义 举 例
() 此字符可以组合括号内模式所匹配的字符,它是一个捕获组,也就是说模式匹配的字符作为最终设置了 ExplicitCapture 选项 ―― 默认状态下字符不是匹配的一部分 输入字符串为: ABC1DEF2XY
匹配 3 个从 A 到 Z 的字符和 1 个数字的正则表达式:( [A-Z]{3}\d )
将产生两次匹配: Match   1=ABC1;Match 2=DEF2
每次匹配对应一个组: Match1 的第一个组= ABC;Match2 的第 1 个组= DEF
有了反向引用,就可以通过它在正则表达式中的编号以及 C# 和类 Group,GroupCollection 来访问组。如果设置了 ExplicitCapture 选项,就不能使用组所捕获的内容

 

(5).字符簇: 

[[:alpha:]] 任何字母。

[[:digit:]] 任何数字。

[[:alnum:]] 任何字母和数字。

[[:space:]] 任何白字符。

[[:upper:]] 任何大写字母。

[[:lower:]] 任何小写字母。

[[:punct:]] 任何标点符号。

[[:xdigit:]] 任何16进制的数字,相当于[0-9a-fA-F]。

 

(6).优先级

转义符

(), (?:), (?=), [] 圆括号和方括号

*, +, ?, {n}, {n,}, {n,m} 限定符

^, $, anymetacharacter 位置和顺序

¦ “或”操作

 

2.常用函数

(1).regexp_like(expression, regexp)

返回值为一个布尔值。如果第一个参数匹配第二个参数所代表的正则表达式,那么将返回真,否则将返回假。

 

(2).regexp_instr(expression, regexp, startindex, times)

返回找到的匹配字符串的位置.

 

(3).regexp_substr(expression, regexp)

返回第一个字符串参数中,与第二个正则表达式参数相匹配的子字符串。

 

(4).regexp_replace(expression, regexp, replacement)

将expression中的按regexp匹配到的部分用replacement代替.

 

(5).REGEXP_COUNT (source_char, pattern [, position [, match_param]])

REGEXP_COUNT 返回pattern 在source_char 串中出现的次数。如果未找到匹配,则函数返回0。position 变量告诉Oracle 在源串的什么位置开始搜索。在开始位置之后每出现一次模式,都会使计数结果增加1。

match_param 变量支持下面几个值:

‘i’ 用于不区分大小写的匹配

‘c’ 用于区分大小写的匹配

‘n’ 允许句点(.)作为通配符去匹配换行符。如果省略该参数,则句点将不匹配换行符

‘m’ 将源串视为多行。即Oracle 将^和$分别看作源串中任意位置任何行的开始和结束,而不是仅仅看作整个源串的开始或结束。如果省略该参数,则Oracle将源串看作一行。

‘x’ 忽略空格字符。默认情况下,空格字符与自身相匹配。

 

3.示例:

(1).查找id为4位数的记录

select data_object_id,object_name from HH where regexp_like(data_object_id,'^[[:digit:]]{3}$');

select data_object_id,object_name from HH where regexp_like(data_object_id,'^\d{3}$');

 

(2).查找对象名包含英文和下划线的记录

select object_name from HH where regexp_like(object_name,'^[a-z|A-Z|_]*$')

 

(3).对象名以a或A开头的记录

select object_name from HH where regexp_like(object_name,'^[a|A]')

 

(4).查找对象名为全英文,并且以N结尾

select object_name from HH where regexp_like(object_name,'^[a-z|A-Z]*N$')

 

(5).查找以非数字开头的员工信息

select object_name from HH where regexp_like(object_name,'^[^\d]');

 

(6).查找对象名中第一个特殊字符的位置

select object_name,regexp_instr(object_name,'[^[:alnum:]]',1) from HH;

 

(7).从第三个字符开始,查找员工编号中第二个非数字字符的位置

select object_name,regexp_instr(object_name,'[^[:alnum:]]',3,2) from HH

 

(8).返回从第二个字符开始检索,并且对象名以L开头$结尾的子串

select object_name,regexp_substr(object_name,'L.*\$$',2) from HH;

 

(9).把对象名中所有非字母字符替换为“A”

select regexp_replace(object_name,'[^a-z|A-Z]','A') from HH;

 

(10).查询字符串中was的出现次数,忽略大小写。

select regexp_count ('THE PRO-NIECE WAS BORN TODAY, SO EXCITING!', 'Was', 1,'i') from dual;

 

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/15412087/viewspace-2199864/,

posted @ 2020-01-16 14:25  路过的雨  阅读(724)  评论(0编辑  收藏  举报