终于明白vim 和 grep 中 的正则表达式的用法, vim 正则表达式 和grep基本正则表达式 几乎一样
要搞清楚 vim中的正则和普通的Perl正则表达式的区别:
因为在perl中所有的元字符 都可以直接使用, 不需要在 元字符的前面加 反斜杠.
但是在vim, 包括grep中就有所区别, 同样是元字符, 有的就要在前面加上 反斜杠才行. 由于 vim和grep各自的关于正则的用法不尽相同, 所以 只能是 一个一个的记清楚,别的没有什么好办法了. 主要是记住不同的地方.
第一, 只说在vim中的正则: 参考: https://www.tuicool.com/articles/QzUBZr
- 首先 vim中的元字符 有 四种情形, 分别表示的是 四种作用:
- 用来表示 单个 的 字符 的 元字符; (即 "字符"元字符, 注意的是, 每个字符元字符 表示的, 代表的总是 一个 字符 因为 你是一个元字符嘛, 所以你也只能代表一个字符, 要表示数量, 有专门的 "数量"元字符)
- 用来表示 数量的 元字符; 即 "数量"元字符
- 用来表示 位置的 元字符 , 即 "位置" 元字符
- 用来表示 分组的 元字符 即 "分组" 元字符. (括号元字符)
- 在这些元字符中
-
字符元字符包括: ., [abc] ,[^abc] , 以及专门符号表示的, 如:
\d, \D, \w, \W, \x. \X, \s, \S (注意 如果要表示空格字符的话, 使用 \s)
或者要表示空格, 使用\空格,
这里, 空格必须转义 因为默认的, 空格表示 命令单词的 分割.
如果要 表示 "字符元字符"本身的话, 要用\ 转义, 比如:\. \[ \* \\
-
数量元字符中, 只有* 不用反斜杠, 其他的都要用 反斜杠, 包括:
\+, \? \{m, n}
, 注意, 大括号表示次数, 模糊匹配次数, 只需要在第一个大括号前加反斜杠, 当然在第二个大括号前加反斜杠也是可以的. 比如:/k\{2, 4}/ = /k\{2, 4\}
-
位置元字符, 只有四个:
^, $, \<表示单词的开头 , \> 表示单词的结尾. 很清楚的: ^ 说的是 行首, 是匹配 **一行**的 开始 , 关心的是行! 而 \<才是句中的 单词 的词首. 一个是行首, 一个是词首. ...
如果只是要匹配 1个 单词, 则使用\w*
因为当一个单词结束时, 必然会遇到空格或 其他标点符号.
其中\<和 \> 是可以单独使用的,
单词的开头 是以 "空格" 和 标点符号为 标识的 . 所以:/r/ 和 /\<r/ 是不同的
, 特别要注意, 既然是单词 的开头或结尾, 那么 这个单词就必须是以\w, 或 [0-9a-zA-Z]
开头的才行, 如果不是以这些开头的, 就不能算是开头! -
括号元字符, vim中的括号元字符 要用 反斜杠表示 :
\( \)
而 前向 引用仍然用\1, \2
等表示.
大多数的元字符在 替换字符串中, 都将失去意义, 表示普通字符, 只有极少数的几个元字符 仍有意义 比如&...
使用vim的正则表达式主要有 三种情况: 一是 搜索, 二是删除 : 使用 /d命令
, 三是 替换
**在使用删除命令 的时候, 略有不同, 默认的是 只删除当前(向下查找)找到的第一个 对象. 如果要表示 整个文件 的 所有的范围的 , 要用 g(=global) 不能用 %(替换用的是%), 而且要放在 最前面, 即 ** : g/^$/d
第二, grep中的正则. 跟 vim中的正则, 除了 "扩展正则" 中的元字符不同外, 其他几乎完全一样, 比如 在数词 元字符的表示上, 大括号都要用 \{m, n \} (这里的 n后面的大括号一定要加\)
- 通常支持的是 "基本正则表达式", 如果要使用 "扩展正则表达式" , 可以有两种方法, 一是, 使用 -E选项, 二是 使用 专门的一个命令: egrep.
- 记住, 扩展的正则表达式, 只比 "基本正则"多4个 元字符:
+, ? |, 括号 ()
比如: 要过滤 bootps或 bootpc
使用cat /etc/services | grep -n 'bootps|bootpc'
会返回空, 而用cat /etc/services | grep -nE 'bootps|bootpc'
则返回bootps和bootpc的行, 这是因为 | 只在 "扩展正则"中被支持
grep的用法上, 除了 要正确使用 单引号 括起来的正则表达式之外, 还要 熟悉它的 几个 常用的选项, 比如: -n, -E , -v(反选) -A, -B 等等.
### 最后记住的是, 正则表达式和 shell的 通配符不一样! shell的通配符通常只有` *, ? [... ] 三个.`