Linux环境下常用regexp的使用

正则表达式

REGular EXPression   的简写
元字符

匹配次数

位置锚定

分组

 

--------------------------------------
元字符
. 匹配任意单个字符

[] 匹配指定范围内任意单个字符


[^] 匹配指定范围外的
[:space:] 空白字符
[:punct:] 标点字符
[:lower:] 小写字母
[:upper:] 大写字母
[:alpha:] 大小写字母
[:digit:] 数字
[:alnum:] 数字和大小写字母


匹配次数(贪婪模式)

* 匹配其前面的字符任意次
a*b b前面a出现任意次数
a.*b a开头b结束
.* 任意长度任意字符

\? 匹配其前面的字符1次或0次 意思是这个字符可有可无
a?b
\{m,n\} 匹配其前面的字符至少m次 至多n次
\{1,\} 至少一次
\{,3\} 至多3次
a.\{1,3\}b a和b之间至少有一个最多有三个字符

位置锚定

^ 锚定行首 此字符后面的任意内容必须出现在行首

$ 锚定行尾 此字符前面的任意内容必须出现在行尾
grep 'b..h$' /etc/passwd
^$ 空白行
\< 其后面的任意字符必须作为单词首部出现
\> 其前面的任意字符必须作为单词尾部出现 \b这个符号的另一种写法


分组
\(\)
\(ab\)* ab 可以出现任意次
\1 第一个左括号以及与之对应的组内容

grep '\(l..e\).*\1' test3.txt


练习: 分析/etc/inittab 文件中如下文本中前两行的特征(每一行中出现在数字必须相同)请写出可以精确找到类似两行的模式
11:1:wait:/etc/rc.d/rc 1

13:1:wait:/etc/rc.d/rc 3

grep '^1\([0-9]\):\1.*\1$' /etc/inittab

grep 使用基本正则表达式定义的模式来过滤文本的命令


----------------------------------------------------
扩展正则表达式

字符匹配
. [] [^]

次数匹配
*
? 无需反斜杠了
+ 匹配其前面的字符至少一次 \{1,\}
{m,n} 不需要反斜线

位置锚定
^
$
\<
\>

分组
() 不用反斜杠
\1,\2

或者
a|b or的意思
C|cat 整个左边和右边
Cat或者cat 错
C或者cat 对

grep -E 'C|cat' text.txx

{3}重复三次

 

fgrep 不支持正则表达式 特别快

 

posted on 2015-05-04 20:26  manue1  阅读(614)  评论(0编辑  收藏  举报

导航