oracle正则表达式

1. 正则表达式规范

(1).匹配字符

字符类	匹配的字符	举例
\d	从０-９的任一数字	\d\d 匹配 72, 但不匹配 aa 或 7a
\D	任一非数字字符	\D\D\D 匹配 abc, 但不匹配 123
\w	任一单词字符，包括A-Z,a-z,0-9和下划线	\w\w\w\w 匹配 Ab-2 ，但不匹配∑ £$%* 或 Ab_@
\W	任一非单词字符	\W 匹配＠，但不匹配 a
\s	任一空白字符，包括制表符，换行符，回车符，换页符和垂直制表符	匹配在 HTML,XML 和其他标准定义中的所有传统空白字符
\S	任一非空白字符	空白字符以外的任意字符,如A%&g3;等
.	任一字符	匹配除换行符以外的任意字符除非设置了 MultiLine 先项
[…]	括号中的任一字符	[abc] 将匹配一个单字符 ,a,b 或 c.
[…]	括号中的任一字符	[a-z] 将匹配从 a 到 z 的任一字符
[^…]	不在括号中的任一字符	[^abc] 将匹配一个 a 、 b 、 c 之外的单字符 , 可以 a,b 或 A 、 B 、 C
[^…]	不在括号中的任一字符	[a-z] 将匹配不属于 a-z 的任一字符 , 但可以匹配所有的大写字母

(2).重复字符

重复字符	含义	举例
｛n｝	匹配前面的字符 n 次	x{2}匹配xx,但不匹配x或xxx
｛n,｝	匹配前面的字符至少 n 次	x{2}匹配2个或更多的x,如xxx,xxx..
｛n,m｝	匹配前面的字符至少 n 次 , 至多 m 次。如果 n 为，此参数为可选参数	x{2,4}匹配xx,xxx,xxxx,但不匹配xxxxx
?	匹配前面的字符次或 1 次，实质上也是可选的	x?匹配x或零个x
+	匹配前面的字符次或多次	x+匹配x或xx或大于0的任意多个x
*	匹配前面的字符次或更多次	x*匹配0,1或更多个x

(3).定位字符

定位字符	描述
^	随后的模式必须位于字符串的开始位置，如果是一个多行字符串，则必须位于行首。对于多行文本（包含回车符的一个字符串）来说，需要设置多行标志
$	前面的模式必须位于字符串的未端，如果是一个多行字符串，必须位于行尾
\A	前面的模式必须位于字符串的开始位置，忽略多行标志
\z	前面的模式必须位于字符串的未端，忽略多行标志
\Z	前面的模式必须位于字符串的未端，或者位于一个换行符前
\b	匹配一个单词边界，也就是一个单词字符和非单词字符中间的点。要记住一个单词字符是 [a-zA-Z0-9] 中的一个字符。位于一个单词的词首
\B	匹配一个非单词字符边界位置，不是一个单词的词首

(4).分组字符

分组字符	定义	举例
（）	此字符可以组合括号内模式所匹配的字符，它是一个捕获组，也就是说模式匹配的字符作为最终设置了 ExplicitCapture 选项 ―― 默认状态下字符不是匹配的一部分	输入字符串为： ABC1DEF2XY
		匹配 3 个从 A 到 Z 的字符和 1 个数字的正则表达式：（ [A-Z]{3}\d ）
		将产生两次匹配： Match 1=ABC1;Match 2=DEF2
		每次匹配对应一个组： Match1 的第一个组＝ ABC;Match2 的第 1 个组＝ DEF
		有了反向引用，就可以通过它在正则表达式中的编号以及 C# 和类 Group,GroupCollection 来访问组。如果设置了 ExplicitCapture 选项，就不能使用组所捕获的内容

(5).字符簇：

[[:alpha:]] 任何字母。

[[:digit:]] 任何数字。

[[:alnum:]] 任何字母和数字。

[[:space:]] 任何白字符。

[[:upper:]] 任何大写字母。

[[:lower:]] 任何小写字母。

[[:punct:]] 任何标点符号。

[[:xdigit:]] 任何16进制的数字，相当于[0-9a-fA-F]。

(6).优先级

转义符

(), (?:), (?=), [] 圆括号和方括号

*, +, ?, {n}, {n,}, {n,m} 限定符

^, $, anymetacharacter 位置和顺序

¦ “或”操作

2.常用函数

(1).regexp_like(expression, regexp)

返回值为一个布尔值。如果第一个参数匹配第二个参数所代表的正则表达式，那么将返回真，否则将返回假。

(2).regexp_instr(expression, regexp, startindex, times)

返回找到的匹配字符串的位置.

(3).regexp_substr(expression, regexp)

返回第一个字符串参数中，与第二个正则表达式参数相匹配的子字符串。

(4).regexp_replace(expression, regexp, replacement)

将expression中的按regexp匹配到的部分用replacement代替.

(5).REGEXP_COUNT (source_char, pattern [, position [, match_param]])

REGEXP_COUNT 返回pattern 在source_char 串中出现的次数。如果未找到匹配，则函数返回0。position 变量告诉Oracle 在源串的什么位置开始搜索。在开始位置之后每出现一次模式，都会使计数结果增加1。

match_param 变量支持下面几个值：

‘i’ 用于不区分大小写的匹配

‘c’ 用于区分大小写的匹配

‘n’ 允许句点(.)作为通配符去匹配换行符。如果省略该参数，则句点将不匹配换行符

‘m’ 将源串视为多行。即Oracle 将^和$分别看作源串中任意位置任何行的开始和结束，而不是仅仅看作整个源串的开始或结束。如果省略该参数，则Oracle将源串看作一行。

‘x’ 忽略空格字符。默认情况下，空格字符与自身相匹配。

3.示例:

(1).查找id为4位数的记录

select data_object_id,object_name from HH where regexp_like(data_object_id,'^[[:digit:]]{3}$');

select data_object_id,object_name from HH where regexp_like(data_object_id,'^\d{3}$');

(2).查找对象名包含英文和下划线的记录

select object_name from HH where regexp_like(object_name,'^[a-z|A-Z|_]*$')

(3).对象名以a或A开头的记录

select object_name from HH where regexp_like(object_name,'^[a|A]')

(4).查找对象名为全英文，并且以N结尾

select object_name from HH where regexp_like(object_name,'^[a-z|A-Z]*N$')

(5).查找以非数字开头的员工信息

select object_name from HH where regexp_like(object_name,'^[^\d]');

(6).查找对象名中第一个特殊字符的位置

select object_name,regexp_instr(object_name,'[^[:alnum:]]',1) from HH;

(7).从第三个字符开始，查找员工编号中第二个非数字字符的位置

select object_name,regexp_instr(object_name,'[^[:alnum:]]',3,2) from HH

(8).返回从第二个字符开始检索，并且对象名以L开头$结尾的子串

select object_name,regexp_substr(object_name,'L.*\$$',2) from HH;

(9).把对象名中所有非字母字符替换为“A”

select regexp_replace(object_name,'[^a-z|A-Z]','A') from HH;

(10).查询字符串中was的出现次数，忽略大小写。

select regexp_count ('THE PRO-NIECE WAS BORN TODAY, SO EXCITING!', 'Was', 1,'i') from dual;

来自 “ ITPUB博客 ” ，链接：http://blog.itpub.net/15412087/viewspace-2199864/，

posted @ 2020-01-16 14:25 路过的雨阅读(788) 评论(0) 收藏举报

刷新页面返回顶部

路过的雨

oracle正则表达式

公告