Linux命令篇 - grep 命令

grep

grep searches the named input FILEs (or standard input if no files are named, or if a single hyphen-minus (-) is given as file name) for lines containing a match to the given PATTERN. By default, grep prints the matching lines.

grep:用于全面搜索的正则表达式,并将结果输出;

格式

  • grep [OPTIONS] PATTERN [FILE...]
  • grep [OPTIONS] [-e PATTERN | -f FILE] [FILE...]

egrep则是扩展搜索命令,等价于“grep -E”命令,支持扩展的正则表达式。而fgrep则是快速搜索命令,等价于“grep -F”命令,不支持正则表达式,直接按照字符串内容进行匹配;

使用grep命令时,如果想要获取匹配特定模式(字符串)后,后面剩余行的内容,可以使用-A(之后),-B(之前),或-C(上下文)选项来打印出匹配行之后的行;

grep -A 命令在使用时,如果遇到文件结束 EOF 或者遇到 } 字符,grep会停止进一步的搜索;这是因为grep默认情况下会把输入文件作为一连串的文本行来处理,一旦遇到文件结束符或者特定的行结束符,它就会停止读取;如果希望grep在遇到}时继续往下搜索,而不是停止,你可以使用 -P(Perl正则表达式模式)选项,这样 grep 会使用 Perl 正则表达式进行搜索,它支持更多的正则表达式特性,包括递归匹配和多行匹配。

常用参数:

-i 忽略大小写
-c 只输出匹配行的数量
-C 输出匹配行的上下文
-l 只列出符合匹配的文件名,不列出具体的匹配行
-n 列出所有的匹配行,显示行号
-h 查询多文件时不显示文件名
-s 不显示不存在、没有匹配文本的错误信息
-v 显示不包含匹配文本的所有行
-w 匹配整词
-x 匹配整行
-r 递归搜索
-q 禁止输出任何结果,已退出状态表示搜索是否成功
-b 打印匹配行距文件头部的偏移量,以字节为单位
-o 与-b结合使用,打印匹配的词据文件头部的偏移量,以字节为单位
-F 匹配固定字符串的内容
-E 支持扩展的正则表达式

参考案例:

  • 在单个文件中搜索内容
$ grep "root" /etc/passwd
root:x:0:0:root:/root:/bin/bash
operator:x:11:0:operator:/root:/sbin/nologin
  • 在多个文件中搜索内容
$ grep "root" /etc/passwd /etc/group
/etc/passwd:root:x:0:0:root:/root:/bin/bash
/etc/passwd:operator:x:11:0:operator:/root:/sbin/nologin
/etc/group:root:x:0:
  • 在文件中搜索内容(不区分大小写)
# 使用 -i 忽略大小写
$ grep -i HAL /etc/passwd
halt:x:7:0:halt:/sbin:/sbin/halt
haldaemon:x:68:68:HAL daemon:/:/sbin/nologin
  • 递归搜索
# 递归搜索使用 -i
# If you want to include symlinks use -R.
$ grep -r nginx /var
  • 在管道中使用grep过滤
# ls -R / : 递归显示ls
# grep backup: 输出文件命名中包含backup
# 单个grep
$ ls -R / |grep backup

# 多个grep
$ ps -ef | grep docker | grep apache
  • 使用基础正则表达式
# 搜索以yum为开头的行
$ grep "^yum" /opt/reposinstall.sh 
yum clean all
yum makecache
yum install -y epel-release.noarch
yum clean all
yum makecache
yum repolist all
  • 匹配完整词
# -w : 使用参数-w匹配完整的词
$ grep -iw "aliyun" /etc/yum.repos.d/CentOS-Base.repo
  • 显示匹配后的N行
# -A选项,在匹配的字符串后显示N行
$ grep -A 1 "root" /etc/passwd
  • 显示匹配前的N行
# -B选项,在匹配的字符串前显示N行
$ grep -B 1 "root" /etc/passwd
  • 搜索多个字符串(使用 -E)
# -E : 使用正则表达式过滤内容
# -w : 匹配整个词
$ ls | grep -w -E "a|reposinstall"
a.out
reposinstall.sh
  • 搜索多个字符串(不使用 -E)
# 需要使用\转义|
$ grep "yum\|aliyun\|bar" *.sh
  • 排除特定的字符
# 使用-v选项忽略搜索。下面的命令将在除“syslog.log”之外的所有文件中搜索字符串“error”
$ grep -r error * | grep -v ‘/\syslog.log/’
  • 输出匹配行的数量
# 测试数据
$ cat > a.out << EOF
TYPE=Ethernet
PROXY_METHOD=none
BROWSER_ONLY=no
BOOTPROTO=static
DEFROUTE=yes
IPV4_FAILURE_FATAL=no
IPV6INIT=yes
IPV6_AUTOCONF=yes
IPV6_DEFROUTE=yes
IPV6_FAILURE_FATAL=no
IPV6_ADDR_GEN_MODE=stable-privacy
NAME=ens32
UUID=53eb3239-d967-4079-9e11-28c7ccd12821
DEVICE=ens32
ONBOOT=yes
IPADDR=192.168.188.97
NETWASK=255.255.255.0
GATEWAY=192.168.188.2
DNS1=114.114.114.114
DNS2=192.168.188.2
DNS3=8.8.8.8
EOF

# 查找匹配 IPV6 的数据
$ cat a.out |grep IPV6
IPV6INIT=yes
IPV6_AUTOCONF=yes
IPV6_DEFROUTE=yes
IPV6_FAILURE_FATAL=no
IPV6_ADDR_GEN_MODE=stable-privacy

# 匹配 IPV6 行数
$ cat a.out|grep IPV6 -c
5
  • 输出匹配行的上下文
# 测试数据
$ cat > a.out << EOF
TYPE=Ethernet
PROXY_METHOD=none
BROWSER_ONLY=no
BOOTPROTO=static
DEFROUTE=yes
IPV4_FAILURE_FATAL=no
IPV6INIT=yes
IPV6_AUTOCONF=yes
IPV6_DEFROUTE=yes
IPV6_FAILURE_FATAL=no
IPV6_ADDR_GEN_MODE=stable-privacy
NAME=ens32
UUID=53eb3239-d967-4079-9e11-28c7ccd12821
DEVICE=ens32
ONBOOT=yes
IPADDR=192.168.188.97
NETWASK=255.255.255.0
GATEWAY=192.168.188.2
DNS1=114.114.114.114
DNS2=192.168.188.2
DNS3=8.8.8.8
EOF

# 查找匹配 IPADDR 的数据
$ cat a.out |grep IPADDR
IPADDR=192.168.188.97

# 匹配 IPADDR 后输出 IPADDR 上下文2行
$ cat a.out|grep IPADDR -C 2  # 等价于 cat a.out|grep -2 IPADDR
DEVICE=ens32
ONBOOT=yes
IPADDR=192.168.188.97
NETWASK=255.255.255.0
GATEWAY=192.168.188.2

# 匹配 IPADDR 后输出 IPADDR 上下文2行
$ cat a.out|grep -2 IPADDR
DEVICE=ens32
ONBOOT=yes
IPADDR=192.168.188.97
NETWASK=255.255.255.0
GATEWAY=192.168.188.2
  • 获取匹配内容后,指定输出前后行数
# 测试数据
$ cat > a.out << EOF
TYPE=Ethernet
PROXY_METHOD=none
BROWSER_ONLY=no
BOOTPROTO=static
DEFROUTE=yes
IPV4_FAILURE_FATAL=no
IPV6INIT=yes
IPV6_AUTOCONF=yes
IPV6_DEFROUTE=yes
IPV6_FAILURE_FATAL=no
IPV6_ADDR_GEN_MODE=stable-privacy
NAME=ens32
UUID=53eb3239-d967-4079-9e11-28c7ccd12821
DEVICE=ens32
ONBOOT=yes
IPADDR=192.168.188.97
NETWASK=255.255.255.0
GATEWAY=192.168.188.2
DNS1=114.114.114.114
DNS2=192.168.188.2
DNS3=8.8.8.8
EOF

# 查找匹配 IPADDR 的数据
$ cat a.out |grep IPADDR
IPADDR=192.168.188.97

# 匹配 IPADDR 后输出 IPADDR 往后2行
$ cat a.out|grep -A 2 IPADDR
IPADDR=192.168.188.97
NETWASK=255.255.255.0
GATEWAY=192.168.188.2

# 匹配 IPADDR 后输出 IPADDR 往前2行
$ cat a.out|grep -B 2 IPADDR
IPADDR=192.168.188.97
NETWASK=255.255.255.0
GATEWAY=192.168.188.2
  • 获取匹配内容后,删除文本中的空行
# 测试数据
$ cat > a.out << EOF


stop-writes-on-bgsave-error yes

rdbcompression yes

rdbchecksum yes


dbfilename dump.rdb

rdb-del-sync-files no

dir ./
EOF

# 输出去掉空行后的内容
$ cat a.out |grep -v -e '^$'
stop-writes-on-bgsave-error yes
rdbcompression yes
rdbchecksum yes
dbfilename dump.rdb
rdb-del-sync-files no
dir ./
  • 匹配 hello world 字符串,指定输出 前、后、上下文 行数
# 想要打印出匹配"hello world"之后的5行内容, 可以使用以下命令:
$ grep -A 5 "hello world" filename

# 想要打印出匹配"hello world"之前的5行内容, 可以使用以下命令:
$ grep -B 5 "hello world" filename

# 想要同时打印出匹配"hello world"前后各5行的内容, 可以使用以下命令:
$ grep -C 5 "hello world" filename
  • 匹配 hello world 字符串后,遇到结束标志( }EOF )停止(不停止)后续的匹配
# 匹配字符串后,输出往后 999 行,遇到 } 或文件结束符就会停止匹配后续的hello
$ grep -A 999 ‘hello’ a.out

# 匹配字符串后,输出往后 999 行,遇到 } 或文件结束符就不会停止匹配后续的hello
$ grep -P '.*?hello' file.txt
  • 匹配字符串 hello 后直到 } 内的所有内容
# 匹配特定模式(字符串)后直至 } 的内容
## 使用正则表达式的贪婪匹配模式(.*)
## 确保不要跨越多行, 因此使用-z选项处理null字节结束的数据, 或者使用-Z选项并且grep的输出以null字节结束
$ grep -ozP 'start.*?(?=}})' filename
或
$ grep -ozP 'start[^}]*' filename

## 参数详解
-o: 选项表示仅输出匹配的部分
-P: 表示使用Perl兼容的正则表达式
start: 要匹配的字符串, 这是是hello
posted @ 2022-05-03 01:33  HOsystem  阅读(1647)  评论(0编辑  收藏  举报