正则表达式中限定符与定位符的使用

193. 有效电话号码

思路

使用正则表达式来检索符合要求的字符串。


需要找出固定的字符位置与可变字符的规律,然后用正则表达式中的普通字符、特殊字符、限定符、定位符来描述对应的规律。

使用正则表达式描述
1、表达(xxx) xxx-xxxx

^\([0-9][0-9][0-9]\) [0-9][0-9][0-9]-[0-9][0-9][0-9][0-9]$

优化:

^\([0-9]{3}\) [0-9]{3}-[0-9]{4}$
  • \ :转义符
  • ^ :限制开头
  • $ :限制结尾
  • [0-9] :数字
  • [0-9]{3} :表示三位数

2、表达 xxx-xxx-xxxx

^[0-9][0-9][0-9]-[0-9][0-9][0-9]-[0-9][0-9][0-9][0-9]$

优化:

^[0-9]{3}-[0-9]{3}-[0-9]{4}$

3、同时表示xxx-xxx-xxxx和 (xxx) xxx-xxxx

^([0-9]{3}-|\([0-9]{3}\) )[0-9]{3}-[0-9]{4}$
  • () :标记一个表达式
  • | :指明两项之间的任意选择

代码

grep

grep -P '^([0-9]{3}-|\([0-9]{3}\) )[0-9]{3}-[0-9]{4}$' file.txt
  • -P:可以让grep使用perl的正则表达式语法,因为perl的正则更加多元化,能实现更加复杂的场景
    awk
awk '/^([0-9]{3}-|\([0-9]{3}\) )[0-9]{3}-[0-9]{4}$/' file.txt
  • //纯字符匹配

gawk

gawk '/^([0-9]{3}-|\([0-9]{3}\) )[0-9]{3}-[0-9]{4}$/' file.txt

快速查看表

特殊字符表达

限定符表达

限定符前面字符的出现次数

限定符 表达含义
* 出现次数>=0
+ 出现次数>=1
? 出现次数 0 or 1, 等价
出现次数=n
出现次数>=n
n=< 出现次数<= m

定位符表达

定位符 表达含义
^ 字符串开始的位置
$ 字符串结束的位置
\b 限定单词(字)的字符,常用来确定一个单词,可以结合两个‘\b’使用
\B 限定非单词(字)边界的字符,用的很少
posted @ 2022-03-29 23:21  当康  阅读(402)  评论(0编辑  收藏  举报