【SQL查询】正则表达式匹配字符串_regexp_like/substr/instr/replace
1. 元字符说明
元字符 | 含义 |
^ | 匹配输入字符串的开始位置。 |
$ | 匹配输入字符串的结尾位置。 |
* | 匹配前面的字符零次或多次。 |
+ | 匹配前面的字符一次或多次。 |
? | 匹配前面的字符零次或一次。 |
. | 匹配任何字符,除了空. |
| | 指明两项之间的一个选择。例子'^([a-z]+|[0-9]+)$'表示所有小写字母或数字组合成的字符串。 |
[ ] | 用于指定要在其中尝试匹配列表中任何一个字符的匹配列表。 |
[^ ] | 用于指定一个不匹配列表,要尝试匹配除列表中的字符之外的任何字符。 |
[…] | 接受括号中的任一字符 |
[^…] | 不接受括号中的任一字符 |
( ) | 标记一个子表达式的开始和结束位置(字符组)。 |
{m} | 正好匹配 m 次 |
{m,} | 至少匹配 m 次 |
{m,n} | 一个精确地出现次数范围,m=<出现次数<=n,'{m}'表示出现m次,'{m,}'表示至少出现m次。 |
[..] | 匹配一个可以是多个字符的排序规则元素。 |
[::] | 匹配字符类。 |
[==] | 匹配等价类。 |
\n | n是1和9之间的数字。匹配在遇到\n之前在()中找到的第n个子表达式。 |
\d | 匹配一个数字字符. |
\D | 匹配一个非数字字符. |
\w | 匹配包括下划线的任何单词字符. |
\W | 匹配任何非单词字符. |
\s | 任一空白字符,包括制表符,换行符,回车符,换页符和垂直制表符 |
\S | 匹配任何非空白字符. |
\A | 前面的模式必须位于字符串的开始位置,忽略多行标志 |
\Z | 前面的模式必须位于字符串的未端,或者位于一个换行符前 |
*? | 与前前面的模式匹配零个或多个匹配项。 |
+? | 匹配前面一个模式一次或多次。 |
?? | 匹配前面一个模式零或一个发生。 |
{n}? | 匹配前面的模式n次。 |
{n,}? | 与前一个模式匹配至少n次 |
{n,m}? | 与前一个模式匹配至少n次,但不超过m次。 |
2. oracle正则表达式的4个函数
(1) regexp_like
1) 语法
REGEXP_LIKE ( expression, pattern [, match_parameter ] )
2) 参数说明
expression:字符表达式
pattern:正则表达式
match_parameter:可选的。它允许修改REGEXP_LIKE
条件的匹配行为。它可以是以下的组合:
值 | 描述 |
---|---|
'c' | 执行区分大小写匹配。 |
'i' | 执行不区分大小写的匹配。 |
'n' | 允许句点字符(. )与换行符匹配。 默认情况下,句点是通配符。 |
'm' | 表达式假定有多个行,其中^ 是行的开始,$ 是行的结尾,不管表达式中这些字符的位置如何。默认情况下,表达式假定为单行。 |
'x' | 忽略空格字符。默认情况下,空格字符与任何其他字符一样匹配。 |
3) 示例
--与like的功能类似 select * from fzq where regexp_like(value,'1....60');
(2) regexp_substr
1) 语法
regexp_substr(source_string,pattern[,position[,occurrence[,match_parameter]]])
2) 参数说明
source_string:源串,可以是常量,也可以是某个值类型为串的列。
pattern:正则表达式
position:从源串开始搜索的位置。默认为1。
occurrence:指定源串中的第几次出现。默认值1.
match_parameter:省略该参数时:默认区分大小写、句点不匹配换行符、源串被看作一行。
值 | 说明 |
i' | 用于不区分大小写的匹配。 |
c' | 用于区分大小写的匹配。 |
n' | 允许将句点“.”作为通配符来匹配换行符。如果省略改参数,句点将不匹配换行符。 |
m' | 将源串视为多行。即将“^”和“$”分别看做源串中任意位置任意行的开始和结束,而不是看作整个源串的开始或结束。 |
3) 示例
SELECT REGEXP_SUBSTR ('hello my phone is 520 ', '[0-9]+') FROM dual; --520
(3) regexp_instr
1) 语法
regexp_instr(source_string,pattern[,position[,occurrence[,return_option[,match_parameter]]]])
2) 参数说明
source_string:源串,可以是常量,也可以是某个值类型为串的列。
pattern:正则表达式
position:可选。搜索在字符串中的开始位置。如果省略,则默认为1,这是字符串中的第一个位置。
occurrence:可选。它是模式字符串中的第n个匹配位置。如果省略,默认为1。
return_option:可选 指定Oracle返回的位置。如果指定0,那么Oracle将返回出现的第一个字符的位置。这是默认的。如果指定1,则Oracle返回字符之后发生的位置。
match_parameter:可选。它允许你修改REGEXP_INSTR功能匹配的行为。它可以是以下的组合:
值 | 描述 |
---|---|
'c' | 执行区分大小写匹配。 |
'i' | 执行不区分大小写的匹配。 |
'n' | 允许句点字符(. )与换行符匹配。 默认情况下,句点是通配符。 |
'm' | 表达式假定有多个行,其中^ 是行的开始,$ 是行的结尾,不管表达式中这些字符的位置如何。默认情况下,表达式假定为单行。 |
'x' | 忽略空格字符。默认情况下,空格字符与任何其他字符一样匹配。 |
3) 示例
SELECT REGEXP_INSTR ('Itmyhome', 'a|i|o|e|u') FROM dual; -- Result: 6
(4) regexp_replace
1) 语法
regexp_replace(source_string,pattern[,replace_string[,position[,occurrence[,match_parameter]]]])
2) 参数说明
source_string:源串,可以是常量,也可以是某个值类型为串的列。
pattern:正则表达式
replace_string:可选。匹配的模式将被替换replace_string字符串。如果省略replace_string参数,将删除所有匹配的模式,并返回结果字符串。
position:可选。在字符串中的开始位置搜索。如果省略,则默认为1。
occurrence:可选。是一个非负整数默认为1,指示替换操作的发生:如果指定0,那么所有出现将被替换字符串。如果指定了正整数n,那么将替换第n次出现。
match_parameter:可选。它允许你修改REGEXP_REPLACE功能匹配的行为。它可以是以下的组合:
值 | 描述 |
---|---|
'c' | 执行区分大小写匹配。 |
'i' | 执行不区分大小写的匹配。 |
'n' | 允许句点字符(. )与换行符匹配。 默认情况下,句点是通配符。 |
'm' | 表达式假定有多个行,其中^ 是行的开始,$ 是行的结尾,不管表达式中这些字符的位置如何。默认情况下,表达式假定为单行。 |
'x' | 忽略空格字符。默认情况下,空格字符与任何其他字符一样匹配。 |
3) 示例
SELECT REGEXP_REPLACE ('itmyhome is my network id', '^(\S*)', 'luck') FROM dual; Result: luck is my network id