linux正则表达式

正则表达式（或称Regular Expression，简称RE）就是由普通字符（例如字符 a 到 z）以及特殊字符（称为元字符）组成的文字模式。
该模式描述在查找文字主体时待匹配的一个或多个字符串。
正则表达式作为一个模板，将某个字符模式与所搜索的字符串进行匹配。简单的说，正则表示式就是处理字符串的方法，它是以行为单位来进行字符串的处理行为，正则表示式通过一些特殊符号的辅助，可以让使用者轻易的达到搜寻/删除/取代某特定字符串的处理程序。vim、grep、find、awk、sed等命令都支持正则表达式。

常用正则表达式：

1、.代表任意单个字符, 如：/l..e/与包含一个l，后跟两个字符，然后跟一个e的行相匹配 
   ? 匹配零个或一个字符。如：'gr?p'匹配gr后跟一个或没有字符，然后是p的行

2、^代表行的开始。 ^love 如：与所有love开头的行匹配 

3、$代表行的结束。love$ 如：与所有love结尾的行匹配 
那么‘^$’ 就表示空行

4、[…]匹配括号中的字符之一
[abc]      匹配单个字符a或b或c
[123]      匹配单个字符1或2或3
[a-z]      匹配小写字母a-z之一
[a-zA-Z]    匹配任意英文字母之一
[0-9a-zA-Z]匹配任意英文字母或数字之一
注意：上面标红色的单个和之一，不管[]里面多复杂，它的结果都是一个字符！

可以用^标记做[]内的前缀，表示除[]内的字符之外的字符。比如 搜索oo前没有g的字符串的行. 应用 '[^g]oo' 作搜索字符串，^符号如果出现在[]的起始位置表示否定，但是在[]的其他位置是普通字符。[^ab^c] 匹配b或^或c或不是a的任意单个字符

5、* 用于修饰前导字符，表示前导字符出现0次或任意多次
如：'a*grep'匹配所有0个或多个a后紧跟grep的行。“.*”表示任意字符串

6、\? 用于修饰前导字符，表示前导字符出现0或1次
a\? 匹配0或1个a

7、\+ 用于修饰前导字符，表示前导字符出现1或多次
a\+ 匹配1或多个a

8、\{n,m\}  用于修饰前导字符，表示前导字符出现n至m次 （n和m都是整数，且n<m）
a\{3,5\} 匹配3至5个连续的a

\{n,m\}还有其他几种形式：
\{n\}  连续的n个前导字符
\{n,\}  连续的至少n个前导字符
9、\  用于转义紧跟其后的单个特殊字符，使该特殊字符成为普通字符

如：^\.[0-9][0-9] 对以一个句点和两个数字开始


例如：
a* 匹配连续的任意（也包括0）个a
a\? 匹配0或1个a
a\+ 匹配1或多个a
a\{3,5\} 匹配3至5个连续的a
\.* 匹配0或多个连续的.  \.表示普通字符句点

10、｜表示或  如： a|b|c 匹配a或b或c。如：grep|sed匹配grep或sed

11、（），将部分内容合成一个单位组，比如 要搜索 glad 或 good 可以如下 'g(la|oo)d'

posted @ 2019-03-07 09:13 reaperhero 阅读(235) 评论(0) 收藏举报

刷新页面返回顶部

Cleaner

linux正则表达式

公告