正则表达式

   正则表达式由一些普通字符和一些元字符metacharacters)组成。普通字符包括大小写的字母和数字,而元字符则具有特殊的含义,我们下面会给予解释。

 

在最简单的情况下,一个正则表达式看上去就是一个普通的查找串。例如,正则表达式"testing"中没有包含任何元字符,它可以匹配"testing""123testing"等字符串,但是不能匹配"Testing"。接下来我们列出元字符:

 

字符匹配类

 

.:匹配任意单个字符

[]:匹配指定范围内的任意单个字符

[^]:匹配指定范围外的任意单个字符

字符集合:[:digit:] [:alpha:] [:punct:] [:lower:] [:upper:] [:space:] [:alnum:]

 

匹配次数类

*:匹配其前面的字符任意次

.*:任意长度的任意字符

\?:匹配其前面的字符串1次或0

\{m,n\}:匹配其前面的至少m次,至多n

\{1,\}:最少一次

 

位置锚定类

^:行首

$:行尾

^$:空白行

\<:单词首

\>:单词尾

\<\>

 

分组类

\(\):

向后引用

\1:引用第一个左括号以及与之对应的右括号所包括的所有内容

 

接下来看几个例子

最简单的元字符是点,它能够匹配任何单个字符(注意不包括换行符)。假定有个文件test.txt包含以下几行内容:

he is arat

he is in a rut

the food is Rotten

I like root beer

匹配以r开始以t结尾,中间任意一个字符的字符串,如下图匹配到rat和rut

[root@centos6 ~]# grep --color 'r.t' /tmp/test2.txt
he is arat
he is in a rut

匹配以r或R开始以t结尾,中间任意一个字符的字符串,如下图匹配到rat,rut和Rot

[root@centos6 ~]# grep --color '[Rr].t' /tmp/test2.txt
he is arat
he is in a rut
the food is Rotten

匹配以he为行首的行

[root@centos6 ~]# grep --color '^he' /tmp/test2.txt
he is arat
he is in a rut

假定有个文件a.txt如下:

 

a
b
ab
aab
acb
adb
amnb

匹配以b结尾,前面匹配任意次a的字符串

[root@centos6 ~]# grep 'a*b' /tmp/a.txt
b
ab
aab
acb
adb
amnb

匹配以a开头,中间任意长度的字符串,以b结尾的字符串

[root@centos6 ~]# grep 'a.*b' /tmp/a.txt
ab
aab
acb
adb
amnb

匹配a0次或者1次,以b结尾的字符串

[root@centos6 ~]# grep --color 'a\?b' /tmp/a.txt
b
ab
aab
acb
adb
amnb

匹配a最少1次,最多3次,以b结尾的字符串

[root@centos6 ~]# grep --color 'a\{1,3\}b' /tmp/a.txt
ab
aab

匹配以a开头,中间1个到3个任意字符,以b结尾的字符串

查找/etc/fstab中有多少空白行

[root@centos6 ~]# grep '^$' /etc/fstab |wc -l
1

 

 查找/etc/inittab文件中包含任意一个数字,然后还以这个数字结尾的行

 

 显示/boot/grub/grub.conf文件中以一个或多个空白符开头的行

 [root@centos6 ~]# grep '^[[:space:]]\{1,\}' /boot/grub/grub.conf 

root (hd0,0)
kernel /vmlinuz-2.6.32.71 ro root=/dev/mapper/vg_centos6-lv_root rd_NO_LUKS rd_NO_MD rd_LVM_LV=vg_centos6/lv_swap crashkernel=auto LANG=zh_CN.UTF-8 rd_LVM_LV=vg_centos6/lv_root KEYBOARDTYPE=pc KEYTABLE=us rd_NO_DM rhgb quiet
initrd /initramfs-2.6.32.71.img
root (hd0,0)
kernel /vmlinuz-2.6.32-573.18.1.el6.x86_64 ro root=/dev/mapper/vg_centos6-lv_root rd_NO_LUKS rd_NO_MD rd_LVM_LV=vg_centos6/lv_swap crashkernel=auto LANG=zh_CN.UTF-8 rd_LVM_LV=vg_centos6/lv_root KEYBOARDTYPE=pc KEYTABLE=us rd_NO_DM rhgb quiet
initrd /initramfs-2.6.32-573.18.1.el6.x86_64.img
root (hd0,0)
kernel /vmlinuz-2.6.32-573.el6.x86_64 ro root=/dev/mapper/vg_centos6-lv_root rd_NO_LUKS rd_NO_MD rd_LVM_LV=vg_centos6/lv_swap crashkernel=auto LANG=zh_CN.UTF-8 rd_LVM_LV=vg_centos6/lv_root KEYBOARDTYPE=pc KEYTABLE=us rd_NO_DM rhgb quiet
initrd /initramfs-2.6.32-573.el6.x86_64.img
显示/proc/cpuinfo文件中d的一位数或两位数

找出ifconfig命令结果中的ip地址

 ifconfig | egrep -o '(\<([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\>\.){3}\<([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\>'

查找当前系统上名字为student(必须出现在行首)的用户的账号的相关信息,文件为/etc/passwd

[root@centos6 rc.d]# grep '^wangkun\>' /etc/passwd |cut -d: -f3
500

扩展正则表达式:

字符匹配

.:

[]

[^]

次数匹配:

*

+:匹配其前面的字符至少一次

{m,n}

锚定字符

^

$

\<

\>

分组

():分组

\1,\2,\3

或者

|: or

C|cat 

 

posted @ 2018-01-17 09:41  wangyi429111  阅读(133)  评论(0编辑  收藏  举报