Linux命令篇 - grep 命令

grep

grep searches the named input FILEs (or standard input if no files are named, or if a single hyphen-minus (-) is given as file name) for lines containing a match to the given PATTERN. By default, grep prints the matching lines.

grep：用于全面搜索的正则表达式，并将结果输出；

格式：

grep [OPTIONS] PATTERN [FILE...]
grep [OPTIONS] [-e PATTERN | -f FILE] [FILE...]

egrep则是扩展搜索命令，等价于“grep -E”命令，支持扩展的正则表达式。而fgrep则是快速搜索命令，等价于“grep -F”命令，不支持正则表达式，直接按照字符串内容进行匹配；

使用grep命令时，如果想要获取匹配特定模式（字符串）后，后面剩余行的内容，可以使用-A（之后），-B（之前），或-C（上下文）选项来打印出匹配行之后的行；

grep -A 命令在使用时，如果遇到文件结束 EOF 或者遇到 } 字符，grep会停止进一步的搜索；这是因为grep默认情况下会把输入文件作为一连串的文本行来处理，一旦遇到文件结束符或者特定的行结束符，它就会停止读取；如果希望grep在遇到}时继续往下搜索，而不是停止，你可以使用 -P（Perl正则表达式模式）选项，这样 grep 会使用 Perl 正则表达式进行搜索，它支持更多的正则表达式特性，包括递归匹配和多行匹配。

常用参数：

-i	忽略大小写
-c	只输出匹配行的数量
-C	输出匹配行的上下文
-l	只列出符合匹配的文件名，不列出具体的匹配行
-n	列出所有的匹配行，显示行号
-h	查询多文件时不显示文件名
-s	不显示不存在、没有匹配文本的错误信息
-v	显示不包含匹配文本的所有行
-w	匹配整词
-x	匹配整行
-r	递归搜索
-q	禁止输出任何结果，已退出状态表示搜索是否成功
-b	打印匹配行距文件头部的偏移量，以字节为单位
-o	与-b结合使用，打印匹配的词据文件头部的偏移量，以字节为单位
-F	匹配固定字符串的内容
-E	支持扩展的正则表达式

参考案例：

在单个文件中搜索内容

$ grep "root" /etc/passwd
root:x:0:0:root:/root:/bin/bash
operator:x:11:0:operator:/root:/sbin/nologin

在多个文件中搜索内容

$ grep "root" /etc/passwd /etc/group
/etc/passwd:root:x:0:0:root:/root:/bin/bash
/etc/passwd:operator:x:11:0:operator:/root:/sbin/nologin
/etc/group:root:x:0:

在文件中搜索内容（不区分大小写）

# 使用 -i 忽略大小写
$ grep -i HAL /etc/passwd
halt:x:7:0:halt:/sbin:/sbin/halt
haldaemon:x:68:68:HAL daemon:/:/sbin/nologin

递归搜索

# 递归搜索使用 -i
# If you want to include symlinks use -R.
$ grep -r nginx /var

在管道中使用grep过滤

# ls -R / : 递归显示ls
# grep backup: 输出文件命名中包含backup
# 单个grep
$ ls -R / |grep backup

# 多个grep
$ ps -ef | grep docker | grep apache

使用基础正则表达式

# 搜索以yum为开头的行
$ grep "^yum" /opt/reposinstall.sh 
yum clean all
yum makecache
yum install -y epel-release.noarch
yum clean all
yum makecache
yum repolist all

匹配完整词

# -w : 使用参数-w匹配完整的词
$ grep -iw "aliyun" /etc/yum.repos.d/CentOS-Base.repo

显示匹配后的N行

# -A选项，在匹配的字符串后显示N行
$ grep -A 1 "root" /etc/passwd

显示匹配前的N行

# -B选项，在匹配的字符串前显示N行
$ grep -B 1 "root" /etc/passwd

搜索多个字符串（使用 -E）

# -E : 使用正则表达式过滤内容
# -w : 匹配整个词
$ ls | grep -w -E "a|reposinstall"
a.out
reposinstall.sh

搜索多个字符串（不使用 -E）

# 需要使用\转义|
$ grep "yum\|aliyun\|bar" *.sh

排除特定的字符

# 使用-v选项忽略搜索。下面的命令将在除“syslog.log”之外的所有文件中搜索字符串“error”
$ grep -r error * | grep -v ‘/\syslog.log/’

输出匹配行的数量

# 测试数据
$ cat > a.out << EOF
TYPE=Ethernet
PROXY_METHOD=none
BROWSER_ONLY=no
BOOTPROTO=static
DEFROUTE=yes
IPV4_FAILURE_FATAL=no
IPV6INIT=yes
IPV6_AUTOCONF=yes
IPV6_DEFROUTE=yes
IPV6_FAILURE_FATAL=no
IPV6_ADDR_GEN_MODE=stable-privacy
NAME=ens32
UUID=53eb3239-d967-4079-9e11-28c7ccd12821
DEVICE=ens32
ONBOOT=yes
IPADDR=192.168.188.97
NETWASK=255.255.255.0
GATEWAY=192.168.188.2
DNS1=114.114.114.114
DNS2=192.168.188.2
DNS3=8.8.8.8
EOF

# 查找匹配 IPV6 的数据
$ cat a.out |grep IPV6
IPV6INIT=yes
IPV6_AUTOCONF=yes
IPV6_DEFROUTE=yes
IPV6_FAILURE_FATAL=no
IPV6_ADDR_GEN_MODE=stable-privacy

# 匹配 IPV6 行数
$ cat a.out|grep IPV6 -c
5

输出匹配行的上下文

# 测试数据
$ cat > a.out << EOF
TYPE=Ethernet
PROXY_METHOD=none
BROWSER_ONLY=no
BOOTPROTO=static
DEFROUTE=yes
IPV4_FAILURE_FATAL=no
IPV6INIT=yes
IPV6_AUTOCONF=yes
IPV6_DEFROUTE=yes
IPV6_FAILURE_FATAL=no
IPV6_ADDR_GEN_MODE=stable-privacy
NAME=ens32
UUID=53eb3239-d967-4079-9e11-28c7ccd12821
DEVICE=ens32
ONBOOT=yes
IPADDR=192.168.188.97
NETWASK=255.255.255.0
GATEWAY=192.168.188.2
DNS1=114.114.114.114
DNS2=192.168.188.2
DNS3=8.8.8.8
EOF

# 查找匹配 IPADDR 的数据
$ cat a.out |grep IPADDR
IPADDR=192.168.188.97

# 匹配 IPADDR 后输出 IPADDR 上下文2行
$ cat a.out|grep IPADDR -C 2  # 等价于 cat a.out|grep -2 IPADDR
DEVICE=ens32
ONBOOT=yes
IPADDR=192.168.188.97
NETWASK=255.255.255.0
GATEWAY=192.168.188.2

# 匹配 IPADDR 后输出 IPADDR 上下文2行
$ cat a.out|grep -2 IPADDR
DEVICE=ens32
ONBOOT=yes
IPADDR=192.168.188.97
NETWASK=255.255.255.0
GATEWAY=192.168.188.2

获取匹配内容后，指定输出前后行数

# 测试数据
$ cat > a.out << EOF
TYPE=Ethernet
PROXY_METHOD=none
BROWSER_ONLY=no
BOOTPROTO=static
DEFROUTE=yes
IPV4_FAILURE_FATAL=no
IPV6INIT=yes
IPV6_AUTOCONF=yes
IPV6_DEFROUTE=yes
IPV6_FAILURE_FATAL=no
IPV6_ADDR_GEN_MODE=stable-privacy
NAME=ens32
UUID=53eb3239-d967-4079-9e11-28c7ccd12821
DEVICE=ens32
ONBOOT=yes
IPADDR=192.168.188.97
NETWASK=255.255.255.0
GATEWAY=192.168.188.2
DNS1=114.114.114.114
DNS2=192.168.188.2
DNS3=8.8.8.8
EOF

# 查找匹配 IPADDR 的数据
$ cat a.out |grep IPADDR
IPADDR=192.168.188.97

# 匹配 IPADDR 后输出 IPADDR 往后2行
$ cat a.out|grep -A 2 IPADDR
IPADDR=192.168.188.97
NETWASK=255.255.255.0
GATEWAY=192.168.188.2

# 匹配 IPADDR 后输出 IPADDR 往前2行
$ cat a.out|grep -B 2 IPADDR
IPADDR=192.168.188.97
NETWASK=255.255.255.0
GATEWAY=192.168.188.2

获取匹配内容后，删除文本中的空行

# 测试数据
$ cat > a.out << EOF


stop-writes-on-bgsave-error yes

rdbcompression yes

rdbchecksum yes


dbfilename dump.rdb

rdb-del-sync-files no

dir ./
EOF

# 输出去掉空行后的内容
$ cat a.out |grep -v -e '^$'
stop-writes-on-bgsave-error yes
rdbcompression yes
rdbchecksum yes
dbfilename dump.rdb
rdb-del-sync-files no
dir ./

匹配 hello world 字符串，指定输出前、后、上下文行数

# 想要打印出匹配"hello world"之后的5行内容, 可以使用以下命令:
$ grep -A 5 "hello world" filename

# 想要打印出匹配"hello world"之前的5行内容, 可以使用以下命令:
$ grep -B 5 "hello world" filename

# 想要同时打印出匹配"hello world"前后各5行的内容, 可以使用以下命令:
$ grep -C 5 "hello world" filename

匹配 hello world 字符串后，遇到结束标志( } 或 EOF )停止（不停止）后续的匹配

# 匹配字符串后，输出往后 999 行，遇到 } 或文件结束符就会停止匹配后续的hello
$ grep -A 999 ‘hello’ a.out

# 匹配字符串后，输出往后 999 行，遇到 } 或文件结束符就不会停止匹配后续的hello
$ grep -P '.*?hello' file.txt

匹配字符串 hello 后直到 } 内的所有内容

# 匹配特定模式（字符串）后直至 } 的内容
## 使用正则表达式的贪婪匹配模式（.*）
## 确保不要跨越多行, 因此使用-z选项处理null字节结束的数据, 或者使用-Z选项并且grep的输出以null字节结束
$ grep -ozP 'start.*?(?=}})' filename
或
$ grep -ozP 'start[^}]*' filename

## 参数详解
-o: 选项表示仅输出匹配的部分
-P: 表示使用Perl兼容的正则表达式
start: 要匹配的字符串, 这是是hello

posted @ 2022-05-03 01:33 HOsystem 阅读(1871) 评论(0) 收藏举报

刷新页面返回顶部

HOsystem

Linux命令篇 - grep 命令

grep

公告