三剑客之Grep家族
Grep(全局正则表达式版本)允许 对文本文件进行模式查找。如果找到匹配模式, grep打印包含模式的所有行。grep支持基本正 则表达式,也支持其扩展集。
grep有三种变形,即:
(1)Grep:标准grep命令,本章大部分篇幅集中讨论此格式。
(1)Egrep:扩展grep,支持基本及扩展的正则表达式,但不支持 \ q模式范围的应用,与之相 对应的一些更加规范的模式,这里也不予讨论。
(3)Fgrep:快速grep。允许查找字符串而不是一个模式。不要误解单词 f a s t,实际上它与grep速度相当。
新建一个实验文档:data.f
[root@zabbix-server-center test]# cat data.f 48 Dec 3BC1997 LPSX 68.00 LVX2A 138 483 Sept 5AP1996 UPS 65.00 LVX2C 189 47 Oct 3ZL1998 LPSX 43.00 KVM9D 512 219 dec 2CC1999 CAD 23.00 PLV2C 68 484 nov 7PL1996 CAD 49.00 PLV2C 234 483 may 5PA1998 UPS 37.00 KVM9D 644 216 sept 3ZL1998 UPS 86.00 KVM9E 234
1.grep的一般格式:
g r e p一般格式为: grep [选项] 基本正则表达式 [文件]
这里基本正则表达式可为字符串。
注意:在g r e p命令中输入字符串参数时,最好将其用双引号括起来。例如:“m y s t r i n g”。这样做 有两个原因,一是以防被误解为 s h e l l命令,二是可以用来查找多个单词组成的字符串,例如: “jet plane”,如果不用双引号将其括起来,那么单词 p l a n e将被误认为是一个文件,查询结果 将返回“文件不存在”的错误信息。在调用变量时,也应该使用双引号。在调用模式匹配时,应使用单引号。
1.2grep选项:
常用的g r e p选项有:
-c 只输出匹配行的计数。
-i 不区分大小写(只适用于单字符)。
-h 查询多文件时不显示文件名。
-l 查询多文件时只输出包含匹配字符的文件名。
-n 显示匹配行及行号。
-s 不显示不存在或无匹配文本的错误信息。
-v 显示不包含匹配文本的所有行。
1.3查询多个文件:
如果要在当前目录下所有. d o c文件中查找字符串“s o r t”,方法如下:
grep "sort" *.doc
或者
grep "sort it" *
1.4行匹配
[root@zabbix-server-center test]# grep -c "48" data.f
4
-c参数表示匹配到多少行。grep返回数字4,意义是有4行包含字符串“48”。 完全展示如下;
1.5显示行数
显示满足匹配模式的所有行数。行数在输出第一列,后跟包含4 8的每一匹配行。
[root@zabbix-server-center test]# grep -n "48" data.f
1:48 Dec 3BC1997 LPSX 68.00 LVX2A 138
2:483 Sept 5AP1996 UPS 65.00 LVX2C 189
5:484 nov 7PL1996 CAD 49.00 PLV2C 234
6:483 may 5PA1998 UPS 37.00 KVM9D 644
1.6显示非匹配行(反选)
使用-v参数是反选,显示所有不包含48的各行。
[root@zabbix-server-center test]# grep -v "48" data.f
47 Oct 3ZL1998 LPSX 43.00 KVM9D 512
219 dec 2CC1999 CAD 23.00 PLV2C 68
216 sept 3ZL1998 UPS 86.00 KVM9E 234
1.7精确匹配
在上一例中,抽取字符串“ 48”,返回结果包含诸如484和483等包含 “48”的其他字符串,实际上应精确抽取只包含 48的各行。注意在每个匹配模式中抽取字符串 后有一个<Tab>键/空格键,所以应操作如下:匹配模式后加一个回车键。
[root@zabbix-server-center test]# grep -n "48 " data.f
1:48 Dec 3BC1997 LPSX 68.00 LVX2A 138
使用grep抽取精确匹配的一种更有效方式是在抽取字符串后加 \>。假定现在精确抽取48, 方法如下:推荐使用这种方式!
[root@zabbix-server-center test]# grep -n "48\>" data.f
1:48 Dec 3BC1997 LPSX 68.00 LVX2A 138
1.8大小写敏感
缺省情况下,grep是大小写敏感的,如要查询大小写不敏感字符串,必须使用 - i开关。在 data.f文件中有月份字符Sept,既有大写也有小写,要取得此字符串大小写不敏感查询,方法 如下:使用-i参数
[root@zabbix-server-center test]# grep -i "sept" data.f
483 Sept 5AP1996 UPS 65.00 LVX2C 189
216 sept 3ZL1998 UPS 86.00 KVM9E 234
2.grep和正则表达式
使用正则表达式使模式匹配加入一些规则,因此可以在抽取信息中加入更多选择。使用 正则表达式时最好用单引号括起来,这样可以防止 grep中使用的专有模式与一些 shell命令的 特殊方式相混淆。
2.1模式范围
假定要抽取代码为484和483的城市位置,上一章中讲到可以使用 [ ]来指定字符串范围,这 里用48开始,以3或4结尾,这样抽出484或483。
[root@zabbix-server-center test]# grep '48[3-4]' data.f
483 Sept 5AP1996 UPS 65.00 LVX2C 189
484 nov 7PL1996 CAD 49.00 PLV2C 234
483 may 5PA1998 UPS 37.00 KVM9D 644
2.2不匹配行首
如果要抽出记录,使其行首不是48,可以在方括号中使用^记号,表明查询在行首开始
[root@zabbix-server-center test]# grep '^[^48]' data.f
219 dec 2CC1999 CAD 23.00 PLV2C 68
216 sept 3ZL1998 UPS 86.00 KVM9E 234
2.3设置大小写
使用- i开关可以屏蔽月份Sept的大小写敏感,也可以用另一种方式。这里使用 [ ]模式抽取 各行包含Sept和sept的所有信息。
[root@zabbix-server-center test]# grep '[Ss]ept' data.f
483 Sept 5AP1996 UPS 65.00 LVX2C 189
216 sept 3ZL1998 UPS 86.00 KVM9E 234
如果要抽取包含S e p t的所有月份,不管其大小写,并且此行包含字符串 4 8 3,可以使用管 道命令,即符号“|”左边命令的输出作为“|”右边命令的输入。举例如下:
[root@zabbix-server-center test]# grep '[Ss]ept' data.f | grep "483"
483 Sept 5AP1996 UPS 65.00 LVX2C 189
2.4匹配任意字符
如果抽取以L开头,以D结尾的所有代码,可使用下述方法,因为已知代码长度为 5个字符:.表示一个字符
[root@zabbix-server-center test]# grep 'K...D' data.f
47 Oct 3ZL1998 LPSX 43.00 KVM9D 512
483 may 5PA1998 UPS 37.00 KVM9D 644
将上述代码做轻微改变,头两个是大写字母,中间两个任意,并以 C结尾:
[root@zabbix-server-center test]# grep '[A-Z][A-Z]..C' data.f
483 Sept 5AP1996 UPS 65.00 LVX2C 189
219 dec 2CC1999 CAD 23.00 PLV2C 68
484 nov 7PL1996 CAD 49.00 PLV2C 234
2.5日期查询
一个常用的查询模式是日期查询。先查询所有以 5开始以1 9 9 6或1 9 9 8结尾的所有记录。使 用模式5 . . 199[6,8]。这意味着第一个字符为 5,后跟两个点,接着是 199,剩余两个数字是6或 8。
[root@zabbix-server-center test]# grep '5..199[6,8]' data.f
483 Sept 5AP1996 UPS 65.00 LVX2C 189
483 may 5PA1998 UPS 37.00 KVM9D 644
2.6范围组合
必须学会使用[ ]抽取信息。假定要取得城市代码,第一个字符为任意字符,第二个字符在 0到5之间,第三个字符在0到6之间,使用下列模式即可实现。
[root@zabbix-server-center test]# grep '^.[0-5][0-6]' data.f
216 sept 3ZL1998 UPS 86.00 KVM9E 234
或者
[root@zabbix-server-center test]# grep '^[0-9][0-5][0-6]' data.f
216 sept 3ZL1998 UPS 86.00 KVM9E 234
2.7使用grep匹配“与”或者“或”模式
[root@zabbix-server-center test]# grep -E '216|219' data.f
219 dec 2CC1999 CAD 23.00 PLV2C 68
216 sept 3ZL1998 UPS 86.00 KVM9E 234
2.8匹配特殊字符
查询有特殊含义的字符,诸如$ . ' " * [] ^ | \ + ? ,必须在特定字符前加\。
假设要查询包含“.” 的所有行。
假如要匹配是双引号的所有行:
[root@zabbix-server-center test]# grep '\"' data.f
以同样的方式,如要查询文件名c o n f t r o l l . c o n f(这是一个配置文件),脚本如下:
[root@zabbix-server-center test]# grep 'conftroll\.conf' myprofile
#需要使用\进行转义
3.系统grep命令
3.1目录相关
如果要查询目录列表中的目录,方法如下:
[root@zabbix-server-center etc]# ls -l | grep '^d'
如果在一个目录中查询不包含目录的所有文件,方法如下:
[root@zabbix-server-center etc]# ls -l | grep '^d'
或者
[root@zabbix-server-center etc]# ls -l | grep -v '^d'
要查询其他用户和其他用户组成员有可执行权限的目录集合,方法如下:
[root@zabbix-server-center etc]# ls -l | grep '^d.....x..x'