学习如何在where子句中使用正则表达式更好的控制数据过滤
正则匹配不区分大小写,若需要区分大小写:regexp binary
| # 1 |
| #检索prod_name包含文本1000的所有行 |
| select prod_name |
| from products |
| where prod_name regexp '1000' |
| order by prod_name; |
| # 2 |
| select prod_name |
| from products |
| where prod_name regexp '.000' |
| order by prod_name; |
| # .在正则表达式中表示匹配任意一个字符 |
| #检索两个串之一 |
| select prod_name |
| from products |
| where prod_name regexp '1000|2000' |
| order by prod_name; |
| #可以给出两个以上的or条件,'1000|2000|3000' |
匹配任何单一字符
| select prod_name |
| from products |
| where prod_name regexp '[123] Ton' |
| order by prod_name; |
| #[123]定义一组字符,意为匹配1或2或3 |
| #注意⚠️:除非将|括在一个集合,否则将会应用于整个串。例如:1|2|3 ton会被MySQL理解为“1或2或3 ton” |
| #若想否定一组字符,只需:[^123]即可 |
[0123456789]匹配0-9的10个数字,为简化,也可:[0-9]
当然字母也可以[a-z][d-k]
| select prod_name |
| from products |
| where prod_name regexp '[1-5] ton' |
| order by prod_name; |
已经知道 .、[]、|、-等字符是具有特定含义的,那如何匹配这些特殊字符?
必须使用\作为前导,即转义(escaping)
| select vend_name |
| from vendors |
| where vend_name regexp '\.' |
| order by vend_name; |
同时,\也用来引用元字符(具有特殊含义的字符)
元字符 | 说明 |
---|
\f | 换页 |
\n | 换行 |
\r | 回车 |
\t | 制表 |
\v | 纵向制表 |
为了方便工作,可以使用预定义的字符集,称为字符类(character class)
类 | 说明 |
---|
[:alnum:] | 任意字母和数字(同[a-z][0-9]) |
[:alpha:] | 任意字符 |
[:blank:] | 空格和制表(同[\t]) |
[:cntrl:] | ASCII控制字符(ASCII 0到31和127) |
[:digit:] | 任意数字 |
[:graph:] | 与[:print:]相同,但不包括空格 |
[:lower:] | 任意小写字母 |
[:print:] | 任意可打印字符 |
[:punct:] | 既不在[:alnum:]又不在[:ctrl:]中的任意字符 |
[:space:] | 包括空格在内的任意空白字符 |
[:upper:] | 任意大写字母 |
[:xdigit:] | 任意十六进制数字 |
元字符 | 说明 |
---|
* | 0个或多个匹配 |
+ | 1个或多个匹配 |
? | 0个或1个匹配 |
{n} | 指定数目的匹配 |
{n,} | 不少于指定数目的匹配 |
{n,m} | 匹配数目的范围(m不超过255) |
| # 1 |
| select prod_name |
| from products |
| where prod_name regexp '\([0-9] sticks?\)' |
| order by prod_name; |
| # \(匹配( |
| #[0-9]匹配任意数字 |
| #sticks匹配stick和sticks |
| #\)匹配) |
| #注意⚠️:s后面的?代表它前面的任何字符的0次或1次出现 |
| # 2 匹配连在一起的4位数字 |
| select prod_name |
| from products |
| where prod_name regexp '[[:digit:]]{4}' |
| order by prod_name; |
| #{4}表示要求它前面的字符(任意数字)出现4次 |
| #也可以写为'[0-9][0-9][0-9][0-9]' |
元字符 | 说明 |
---|
^ | 文本的开始 |
$ | 文本的结尾 |
[[:<:]] | 词的开始 |
[[:>:]] | 词的结尾 |
| # 找出一个数(包含.)开始的所有产品 |
| select prod_name |
| from products |
| where prod_name regexp '^[0-9\.]' |
| order by prod_name; |
可以在不使用数据库表的情况下利用select语句进行测试正则表达式
返回0说明不匹配,返回1说明匹配
| select 'hello' regexp '[0-9]'; |
| #返回0,说明不匹配 |
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗?
· 【译】Visual Studio 中新的强大生产力特性
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 【设计模式】告别冗长if-else语句:使用策略模式优化代码结构