shell三剑客之grep
背景
对于很多的测试人员来说,grep命令都很熟悉,用的最多的比如去查找指定的进程:ps -ef | grep *** ,其中***为进程名或进程号,这里我们只用到的grep的最基础功能-从标准输出中过滤指定的字符串,实际上grep的功能远不止如此。这篇文章给大家来介绍下grep的进阶及高阶用法,来帮助我们在测试工作中提升效率。
grep的全称:Global search Regular Expression and Print out the line,是一种强大的文本搜索工具,它能使用特定模式匹配(包括正则表达式)搜索文本,并默认输出匹配行,grep和sed、awk一起成为Linux中的三剑客。grep可以不使用正则,但是跟正则一起配合使用时,功能最为强大!
命令语法
grep提供两种方式:
- grep [option] [pattern] testfile
- stdout | grep [option] [pattern]
语法格式 | 解释 |
---|---|
option | 参数选项 |
pattern | 为查找的字符串或者正则表达式 |
第一种是从文本中直接使用pattern匹配搜索 | |
第二种是从标准输出中处理 | |
grep所提供的option(参数选项) |
参数选项 | 含义 |
---|---|
-i | 搜索时忽略大小写 |
-n | 显示行号 |
-o | 只显示被匹配的关键字,不会打印匹配的整行内容 |
-r | 递归搜索 |
-v | 不显示匹配行信息 |
-q | 静默模式,不输出任何信息,在shell脚本中,可以通过echo $?查看是否匹配到,0表示匹配到,1表示没有匹配到 |
-E | 使用扩展正则表达式 |
我们先从第一个最简单的示例开始:
先准备一个测试文件,内容如下:
hhy@hhy-virtual-machine:~/shellTest$ cat testfile
hello lemonban
test
tomcat Test jenkins
lemon apache test
selenium appium httpclient
java python
TEST
从文本文件中搜索test字符串
hhy@hhy-virtual-machine:~/shellTest$ grep "test" testfile
test
lemon apache test
可以看到包含有"test"的行被打印出来,默认grep是区分大小写的,所以"Test","TEST"没有被匹配出来
如果想要不区分大小写,我们可以加"-i"的参数,如下
hhy@hhy-virtual-machine:~/shellTest$ grep -i "test" testfile
test
tomcat Test jenkins
lemon apache test
TEST
当前我们的测试文本内容比较少,我们肉眼可以见到是在第几行。如果文本行数较多的情况下那就不太方便了,这里就可以用到"-n"的参数
hhy@hhy-virtual-machine:~/shellTest$ grep -i -n "test" testfile
2:test
3:tomcat Test jenkins
4:lemon apache test
7:TEST
包含有"test"的并且不区分大小写的行在开头会显示行号
现在的结果中匹配的关键字所在行全部内容都会输出,如果只想要看到匹配的关键字,怎么办?
使用"-o"参数即可
hhy@hhy-virtual-machine:~/shellTest$ grep -i -n -o "test" testfile
2:test
3:Test
4:test
7:TEST
有时候我们需要对整个目录去搜索关键字,如果直接使用grep "test" 目录名,会报错
加参数'-r'就可以避免这个问题
hhy@hhy-virtual-machine:~$ grep "test" shellTest
grep: shellTest: Is a directory
hhy@hhy-virtual-machine:~$ grep -r "test" shellTest
shellTest/test1.txt:test 1111 aaaaa
shellTest/testfile:test
shellTest/testfile:lemon apache test
可以看到shellTest目录下的两支文件test1.txt以及testfile都包含test被打印出来了
“-q”选项表示使用静默模式,在此模式下grep命令不会有任何的打印结果,无论是否有匹配到。一般来说我们可以根据echo $? 来查看上一条指令(grep)的执行结果,如果返回结果为0,表示grep有匹配到了,如果返回结果为1,表示grep没有匹配到
hhy@hhy-virtual-machine:~/shellTest$ grep "test" testfile
test
lemon apache test
hhy@hhy-virtual-machine:~/shellTest$ grep -q "test" testfile
hhy@hhy-virtual-machine:~/shellTest$ echo $?
0
一般我们可以shell脚本中去用if条件分支进行判断,如果echo $?结果为0,就去执行相应的操作
grep结合pattern正则
前面我们介绍了参数的基本用法,grep的强大之处其实是和正则表达式一起才有作用。
注:本篇文章不会具体介绍正则表达式的使用,如果不了解正则表达式的同学推荐去看下之前相关的文章
我们知道在正则表达式中分为了两类:
基本正则表达式
. 单个字符
* 表示前面的字符连续出现任意次,包括0次
^ 表示锚定行首
$ 表示锚定行尾
[a-z] [0-9] 区间范围
......
扩展正则表达式
? 表示匹配其前面的字符0或1次
+ 表示匹配其前面的字符至少1次,或者连续多次,连续次数上不封顶。
() 分组
{} 连续匹配
| 匹配多个表达式的任何一个
......
如查询以"lemon"单词开头
hhy@hhy-virtual-machine:~/shellTest$ grep "^lemon" testfile
lemon apache test
查找文件中空白行的数量
hhy@hhy-virtual-machine:~/shellTest$ grep -c "^$" testfile
2
正则“^$”表示空白行,参数“-c”表达计算行数
连续字数的正则匹配,如:查找“appium”,p是连续的
hhy@hhy-virtual-machine:~/shellTest$ grep "ap{2}ium" testfile
“{2}”表示p连续出现了两次,可以发现结果是匹配不到的
因为{}是扩展正则表达式,grep默认是基本正则表达式,如果需要支持扩展正则表达式,我们需要加"-E"选项:
hhy@hhy-virtual-machine:~/shellTest$ grep -E "ap{2}ium" testfile
selenium appium httpclient