Shell文本处理三剑客之——grep
1.格式和选项
grep [ -A ] [ -B ] [ --color=auto ] '指定的字符' filename
选择与参数:
- A :后面可加数字,代表after的意思,出来列出改行外,后续的n行也列出来;
- B:后面可加数字,代表befer的意思,出来列出改行外,前面的n行也列出来;
- -color=auto 可将正确的那个选取数据列出颜色(centOS7 默认加入该选项)
注意:grep作为shell文本处理三剑客之一,最重要的功能就是进行字符串数据的对比,然后将符合我们需求的字符串显示出来,grep 在数据中查询一个字符串时,是以整行为单位来进行数据的选取。
2. 结合基础正则练习
参考【鸟哥的Linux私房菜】中的练习文档,可以直接复制下面的文本内容到自己的文本中,也可以使用命令wget http://linux.vbird.org/linux_basic/0330regularex/regular_express.txt 进行下载,我们将使用下面的文件作为案例分析。
文件的内容如下:
[root@cheng0307 ~]# cat regular_express.txt
"Open Source" is a good mechanism to develop programs.
apple is my favorite food.
Football game is not use feet only.
this dress doesn't fit me.
However, this dress is about $ 3183 dollars.
GNU is free air not free beer.
Her hair is very beauty.
I can't finish the test.
Oh! The soup taste good.
motorcycle is cheap than car.
This window is clear.
the symbol '*' is represented as start.
Oh! My god!
The gd software is a library for drafting programs.
You are the best is mean you are the no. 1.
The world <Happy> is the same with "glad".
I like dog.
google is the best tools for search keyword.
goooooogle yes!
go! go! Let's go.
# I am VBird
案例1:查找指定的字符串“google”,并显示行号
命令如下:
grep -n "google" regular_express.txt #正向查找 grep -vn "google" regular_express.txt #反向查找
查找结果
案例2:使用 中括号 [ ] 进行查找相关字符
要求1:查找 test 或者 taste 这两个字符串
命令如下:
grep "t[ae]st" regular_express.txt
查找结果如图:
补充:特殊符号的意思
特殊符号 代表的意思
[:alnum:] 代表英文大小写字符及数字,即0-9、a-z 、A-Z
[:alpha:] 代表任何英文大小写字符,及A - Z、a-z
[:blank:] 代表空格键和【tab】按键
[:cntrl:] 代表键盘上面的控制按键,包括CR、LF、TAB、DEL等
[:digit:] 代表数字,即0 - 9
[:graph:] 除了空格键和【Tab】键外的其他所有按键
[:lower:] 代表小写字符,即a - z
[:print:] 代表任何可以被打印出来的字符
[:punct:] 代表标点符号,即:" ’ ? ! ; : # $
[:upper:] 代表大写字符,即A - Z
[:space:] 代表会产生空白的字符,包含空格键、【Tab】、CR等
[:xdigit:] 代表十六进制的数字类型,因此包括0-9、a-z 、A-Z的数字与字符
案例3:行首与行尾字符 ^ 和 $
要求1:查找以字符串“the”开头的行
grep -n "^the" regular_express.txt
查找结果如图:
要求2:查找以小写字符开头的行
命令如下:
grep -n "^[a-z]" regular_express.txt
或
grep -n "^[[:lower:]]" regular_express.txt
查找结果如图:
要求3:查找英文字符开头的行
命令如下:
grep "^[^a-zA-Z]" regular_express.txt
或
grep "^[^a-Z]" regular_express.txt
查找结果如图:
注意:字符 ^ 在字符集符号(包括[ ])之内与之外是不同的:
在 [ ] 之内:代表反向选择;
在 [ ] 之外:代表定位还行首的意思。
要求4:查找以小数点 . 结尾的行
命令如下:
grep -n "\.$" regular_express.txt
1
查找结果如图:
要求5:查找空白行
命令如下:
grep -n "^$" regular_express.txt
要求6:在/etc/rsyslog.conf中查找不是空白行而且不是以“#”开头的行(相当于去掉空行和注释)
注意:第二次查找的条件一定要是以#开头的,而不是包含#的,因为有些注释会卸载代码的后面。
命令如下:
grep -n -v "^$" /etc/rsyslog.conf | grep -v "^#"
案例4:任意一个字符 . 和重复字符 *
在bash中通配符 * 可以代表任意(0或多个)字符,但是正则表达式并不是通配符,两者之间是不相同的:
. (小数点):代表一定有一个任意字符的意思。
* (星号):代表重复前一个字符,0到无穷个的意思。
要求1:查询包含gxxd的行,x为任意字符
命令如下:
grep -n "g..d" regular_express.txt
查找结果如图
要求2:查询至少包含两个“o”的行 和 gxxg之间至少又两个“o”的行
命令如下:
grep -n "ooo*" regular_express.txt #查询至少包含两个“o”
grep -n "goo*g" regular_express.txt #gxxg之间至少又两个“o”
1
2
查找结果如图:
要求3:查询g开始到g结束,中间的字符可有可无
命令如下:
grep -n "g.*g" regular_express.txt
查找结果如图:
案例5:限定连续RE字符范围{}
由于{ } 的符号在shell中是有特殊意义的,因此,我们必须要使用转义字符 \ 来将花括号转成普通的符号。
要求1:查找两个“o”的字符串
命令如下:
grep -n "o\{2\}" regular_express.txt
1
查找结果如图:
要求2:查找g开始后面“o”的数量为2到5个,然后以g结束的字符串
命令如下:
grep -n "go\{2,5\}g" regular_express.txt
查找结果如图:
要求3:查找g开始后面“o”的数量为2个,然后以g结束的字符串
命令如下:
grep -n "go\{2,\}g" regular_express.txt
查找结果如图: