Linux命令篇 - grep 命令
grep
grep searches the named input FILEs (or standard input if no files are named, or if a single hyphen-minus (-) is given as file name) for lines containing a match to the given PATTERN. By default, grep prints the matching lines.
grep
:用于全面搜索的正则表达式,并将结果输出;
格式
:
- grep [OPTIONS] PATTERN [FILE...]
- grep [OPTIONS] [-e PATTERN | -f FILE] [FILE...]
egrep则是扩展搜索命令,等价于“grep -E”命令,支持扩展的正则表达式。而fgrep则是快速搜索命令,等价于“grep -F”命令,不支持正则表达式,直接按照字符串内容进行匹配;
使用grep命令时,如果想要获取匹配特定模式(字符串)后,后面剩余行的内容,可以使用-A(之后),-B(之前),或-C(上下文)选项来打印出匹配行之后的行;
grep -A 命令在使用时,如果遇到文件结束 EOF
或者遇到 }
字符,grep会停止进一步的搜索;这是因为grep默认情况下会把输入文件作为一连串的文本行来处理,一旦遇到文件结束符或者特定的行结束符,它就会停止读取;如果希望grep在遇到}时继续往下搜索,而不是停止,你可以使用 -P
(Perl正则表达式模式)选项,这样 grep 会使用 Perl 正则表达式进行搜索,它支持更多的正则表达式特性,包括递归匹配和多行匹配。
常用参数:
-i | 忽略大小写 |
---|---|
-c | 只输出匹配行的数量 |
-C | 输出匹配行的上下文 |
-l | 只列出符合匹配的文件名,不列出具体的匹配行 |
-n | 列出所有的匹配行,显示行号 |
-h | 查询多文件时不显示文件名 |
-s | 不显示不存在、没有匹配文本的错误信息 |
-v | 显示不包含匹配文本的所有行 |
-w | 匹配整词 |
-x | 匹配整行 |
-r | 递归搜索 |
-q | 禁止输出任何结果,已退出状态表示搜索是否成功 |
-b | 打印匹配行距文件头部的偏移量,以字节为单位 |
-o | 与-b结合使用,打印匹配的词据文件头部的偏移量,以字节为单位 |
-F | 匹配固定字符串的内容 |
-E | 支持扩展的正则表达式 |
参考案例:
- 在单个文件中搜索内容
$ grep "root" /etc/passwd
root:x:0:0:root:/root:/bin/bash
operator:x:11:0:operator:/root:/sbin/nologin
- 在多个文件中搜索内容
$ grep "root" /etc/passwd /etc/group
/etc/passwd:root:x:0:0:root:/root:/bin/bash
/etc/passwd:operator:x:11:0:operator:/root:/sbin/nologin
/etc/group:root:x:0:
- 在文件中搜索内容(不区分大小写)
# 使用 -i 忽略大小写
$ grep -i HAL /etc/passwd
halt:x:7:0:halt:/sbin:/sbin/halt
haldaemon:x:68:68:HAL daemon:/:/sbin/nologin
- 递归搜索
# 递归搜索使用 -i
# If you want to include symlinks use -R.
$ grep -r nginx /var
- 在管道中使用grep过滤
# ls -R / : 递归显示ls
# grep backup: 输出文件命名中包含backup
# 单个grep
$ ls -R / |grep backup
# 多个grep
$ ps -ef | grep docker | grep apache
- 使用基础正则表达式
# 搜索以yum为开头的行
$ grep "^yum" /opt/reposinstall.sh
yum clean all
yum makecache
yum install -y epel-release.noarch
yum clean all
yum makecache
yum repolist all
- 匹配完整词
# -w : 使用参数-w匹配完整的词
$ grep -iw "aliyun" /etc/yum.repos.d/CentOS-Base.repo
- 显示匹配后的N行
# -A选项,在匹配的字符串后显示N行
$ grep -A 1 "root" /etc/passwd
- 显示匹配前的N行
# -B选项,在匹配的字符串前显示N行
$ grep -B 1 "root" /etc/passwd
- 搜索多个字符串(使用 -E)
# -E : 使用正则表达式过滤内容
# -w : 匹配整个词
$ ls | grep -w -E "a|reposinstall"
a.out
reposinstall.sh
- 搜索多个字符串(不使用 -E)
# 需要使用\转义|
$ grep "yum\|aliyun\|bar" *.sh
- 排除特定的字符
# 使用-v选项忽略搜索。下面的命令将在除“syslog.log”之外的所有文件中搜索字符串“error”
$ grep -r error * | grep -v ‘/\syslog.log/’
- 输出匹配行的数量
# 测试数据
$ cat > a.out << EOF
TYPE=Ethernet
PROXY_METHOD=none
BROWSER_ONLY=no
BOOTPROTO=static
DEFROUTE=yes
IPV4_FAILURE_FATAL=no
IPV6INIT=yes
IPV6_AUTOCONF=yes
IPV6_DEFROUTE=yes
IPV6_FAILURE_FATAL=no
IPV6_ADDR_GEN_MODE=stable-privacy
NAME=ens32
UUID=53eb3239-d967-4079-9e11-28c7ccd12821
DEVICE=ens32
ONBOOT=yes
IPADDR=192.168.188.97
NETWASK=255.255.255.0
GATEWAY=192.168.188.2
DNS1=114.114.114.114
DNS2=192.168.188.2
DNS3=8.8.8.8
EOF
# 查找匹配 IPV6 的数据
$ cat a.out |grep IPV6
IPV6INIT=yes
IPV6_AUTOCONF=yes
IPV6_DEFROUTE=yes
IPV6_FAILURE_FATAL=no
IPV6_ADDR_GEN_MODE=stable-privacy
# 匹配 IPV6 行数
$ cat a.out|grep IPV6 -c
5
- 输出匹配行的上下文
# 测试数据
$ cat > a.out << EOF
TYPE=Ethernet
PROXY_METHOD=none
BROWSER_ONLY=no
BOOTPROTO=static
DEFROUTE=yes
IPV4_FAILURE_FATAL=no
IPV6INIT=yes
IPV6_AUTOCONF=yes
IPV6_DEFROUTE=yes
IPV6_FAILURE_FATAL=no
IPV6_ADDR_GEN_MODE=stable-privacy
NAME=ens32
UUID=53eb3239-d967-4079-9e11-28c7ccd12821
DEVICE=ens32
ONBOOT=yes
IPADDR=192.168.188.97
NETWASK=255.255.255.0
GATEWAY=192.168.188.2
DNS1=114.114.114.114
DNS2=192.168.188.2
DNS3=8.8.8.8
EOF
# 查找匹配 IPADDR 的数据
$ cat a.out |grep IPADDR
IPADDR=192.168.188.97
# 匹配 IPADDR 后输出 IPADDR 上下文2行
$ cat a.out|grep IPADDR -C 2 # 等价于 cat a.out|grep -2 IPADDR
DEVICE=ens32
ONBOOT=yes
IPADDR=192.168.188.97
NETWASK=255.255.255.0
GATEWAY=192.168.188.2
# 匹配 IPADDR 后输出 IPADDR 上下文2行
$ cat a.out|grep -2 IPADDR
DEVICE=ens32
ONBOOT=yes
IPADDR=192.168.188.97
NETWASK=255.255.255.0
GATEWAY=192.168.188.2
- 获取匹配内容后,指定输出前后行数
# 测试数据
$ cat > a.out << EOF
TYPE=Ethernet
PROXY_METHOD=none
BROWSER_ONLY=no
BOOTPROTO=static
DEFROUTE=yes
IPV4_FAILURE_FATAL=no
IPV6INIT=yes
IPV6_AUTOCONF=yes
IPV6_DEFROUTE=yes
IPV6_FAILURE_FATAL=no
IPV6_ADDR_GEN_MODE=stable-privacy
NAME=ens32
UUID=53eb3239-d967-4079-9e11-28c7ccd12821
DEVICE=ens32
ONBOOT=yes
IPADDR=192.168.188.97
NETWASK=255.255.255.0
GATEWAY=192.168.188.2
DNS1=114.114.114.114
DNS2=192.168.188.2
DNS3=8.8.8.8
EOF
# 查找匹配 IPADDR 的数据
$ cat a.out |grep IPADDR
IPADDR=192.168.188.97
# 匹配 IPADDR 后输出 IPADDR 往后2行
$ cat a.out|grep -A 2 IPADDR
IPADDR=192.168.188.97
NETWASK=255.255.255.0
GATEWAY=192.168.188.2
# 匹配 IPADDR 后输出 IPADDR 往前2行
$ cat a.out|grep -B 2 IPADDR
IPADDR=192.168.188.97
NETWASK=255.255.255.0
GATEWAY=192.168.188.2
- 获取匹配内容后,删除文本中的空行
# 测试数据
$ cat > a.out << EOF
stop-writes-on-bgsave-error yes
rdbcompression yes
rdbchecksum yes
dbfilename dump.rdb
rdb-del-sync-files no
dir ./
EOF
# 输出去掉空行后的内容
$ cat a.out |grep -v -e '^$'
stop-writes-on-bgsave-error yes
rdbcompression yes
rdbchecksum yes
dbfilename dump.rdb
rdb-del-sync-files no
dir ./
- 匹配 hello world 字符串,指定输出 前、后、上下文 行数
# 想要打印出匹配"hello world"之后的5行内容, 可以使用以下命令:
$ grep -A 5 "hello world" filename
# 想要打印出匹配"hello world"之前的5行内容, 可以使用以下命令:
$ grep -B 5 "hello world" filename
# 想要同时打印出匹配"hello world"前后各5行的内容, 可以使用以下命令:
$ grep -C 5 "hello world" filename
- 匹配 hello world 字符串后,遇到结束标志(
}
或EOF
)停止(不停止)后续的匹配
# 匹配字符串后,输出往后 999 行,遇到 } 或文件结束符就会停止匹配后续的hello
$ grep -A 999 ‘hello’ a.out
# 匹配字符串后,输出往后 999 行,遇到 } 或文件结束符就不会停止匹配后续的hello
$ grep -P '.*?hello' file.txt
- 匹配字符串
hello
后直到 } 内的所有内容
# 匹配特定模式(字符串)后直至 } 的内容
## 使用正则表达式的贪婪匹配模式(.*)
## 确保不要跨越多行, 因此使用-z选项处理null字节结束的数据, 或者使用-Z选项并且grep的输出以null字节结束
$ grep -ozP 'start.*?(?=}})' filename
或
$ grep -ozP 'start[^}]*' filename
## 参数详解
-o: 选项表示仅输出匹配的部分
-P: 表示使用Perl兼容的正则表达式
start: 要匹配的字符串, 这是是hello