我们一起来学grep

 

 

grep 介绍

  • grep 系列是 Linux 中使用频率最高的文本查找命令。
  • 主要功能在一个或者多个文件中查找特定模式的字符串。如果该行有匹配的字符串,则输出整个行的内容。如果没有匹配的内容,则不输出任何内容。grep命令不改动源文件
  • Linux的grep家族包括grepegrepfgreprgrep
  • grep 可以通过 -G、-E、-F 命令行选项来使用 egrep 和 fgrep 的功能。
    • grep: 在文件中全局查找指定的正则表达式,并打印所有包含该表达式的行
    • egrep: 扩展的egrep,支持更多的正则表达式元字符
    • fgrep: 固定grep(fixed grep),有时也被称作快速(fast grep),它按字面解释所有的字符

grep 命令格式

grep [选项] PATTERN filename filename ...
  • 在每个 FILE 或是标准输入中查找 PATTERN。
  • 默认的 PATTERN 是一个基本正则表达式(缩写为 BRE)。

grep 命令选项

FILE 文件控制  
-B --before-context=NUM 打印过滤关键字和上面NUM行
-A --after-context=NUM 打印过滤关键字和下面NUM行
-C --context=NUM 打印过滤关键字和上下NUM行
-NUM   等同 --context=NUM
  --color[=WHEN] --colour[=WHEN] 高亮颜色突出显示搜索的字符串。值’always’, ‘never’, or ‘auto’。
-U --binary 将文件作为二进制文件处理。仅有MS-DOS和MS-Windows支持该选项
-u --unix-byte-offsets 报告UNIX风格的字节偏移。这个选项仅在同时使用-b选项的情况下才有效;仅有MS-DOS和MS-Windows支持该选项
与 PATTERN 正则表达式相关的选项    
-E --extended-regexp PATTERN 是一个可扩展的正则表达式(缩写为 ERE)
-F --fixed-strings PATTERN 是一组由断行符分隔的定长字符串
-G --basic-regexp PATTERN 是一个基本正则表达式(缩写为 BRE)
-P --perl-regexp PATTERN 是一个 Perl 正则表达式
-e --regexp= PATTERN 用 PATTERN 来进行匹配操作
-f --file=FILE 从 FILE 中取得 PATTERN
-i --ignore-case 忽略大小写
-w --line-regexp 强制 PATTERN 仅完全匹配字词
-x --extended-regexp 强制 PATTERN 仅完全匹配一行
-z --null-data 一个 0 字节的数据行,但不是空行
输出控制选项    
-m --max-count=NUM 在找到指定数量的匹配行后停止读文件
-b --byte-offset 在显示符合样式的那一行之前,标示出该行第一个字符的编号
-n --line-number 在显示符合样式的那一行之前,标示出该行的列数编号
  --line-buffered 刷新输出的每一行
-H --with-filename 在显示符合样式的那一行之前,表示该行所属的文件名称
-h --no-filename 在显示符合样式的那一行之前,不标示该行所属的文件名称
  --label=LABEL 打印标签作为文件名的标准输入(主要用于管道处理) 例如:cat test |grep --label=test -H 123
-o --only-matching 仅输出匹配行的匹配部分
-q --quiet --silent 抑制所有正常输出
  --binary-files=TYPE 假定二进制文件为TYPE类型文件TYPE可以为binary、text或without-match
-a --text 等价于-binary-files=text
-I --binary-files=without-match 等价于–binary-files=without-match
-d --directories=ACTION 当grep的对象为目录时用,处理目录可以读取、递归或跳过
-D --devices=ACTION 当grep的对象为处理设备、栈或套接字时必须用,处理对象可以读取或跳过
-r -R --recursive --directories=recurse 相当于–directories=recurse 遍历目录
  --include=FILE_PATTERN 仅grep匹配的文件模式的文件
  --exclude=FILE_PATTERN 跳过匹配的文件模式的文件和目录进行grep匹配
  --exclude-from=FILE 跳过任一匹配文件模式的文件
  ---exclude-dir=PATTERN 跳过匹配的目录文件目录
-L --files-without-match 仅仅打印未匹配的文件的文件名
-l --files-with-matches 仅仅打印匹配的文件的文件名
-c --count 仅仅打印每个文件的匹配次数
-T --initial-tab 将标签排队(标签即文件名)
-Z --null 打印文件名,文件名与匹配行中间没有空字节 -z与-Z的区别之一:当一个文件有多个匹配行时-z只打印一次文件名,而-Z每匹配一次打印一次文件名
杂项    
-s --no-messages 不显示错误信息
-v --invert-match 打印不匹配的行

grep 实例

查找指定进程

ps -ef | grep kube-apiserver

root 6310 5764 0 14:34 pts/1 00:00:00 grep --color=auto kube-apiserver

这个结果是grep进程本身,并非真正要找的进程

查找指定进程个数

grep -c统计的进程个数,会包含了grep本身的进程

ps -ef | grep docker -c

先使用-v参数,排除grep自身的进程,再去过滤指定进程的个数

ps -ef | grep -v grep | grep docker -c

从文件中读取关键词进行搜索

先准备两个有内容的文件

cat <<EOF > test.txt
hello world
redhat
suse sle
centos
ubuntu
redhat
linux
EOF
cat <<EOF > test2.txt
linux
redhat
EOF

输出 test.txt 文件中含有从 test2.txt 文件中读取出的关键词的内容行

cat test.txt | grep -f test2.txt

显示行号(关键字在文本内的行数)的话,加上-n参数即可

cat test.txt | grep -nf test2.txt

从多个文件中查找关键字

grep linux test.txt test2.txt

输出以u开头的行

grep "^u" test.txt

输出非u开头的行

grep -v "^u" test.txt
grep ^[^u] test.txt

输出以hat结尾的行

grep "hat$" test.txt

输出se或者ed字符的行

egrep "se|ed" test.txt

使用方括号表达式匹配括号内的任一字符

ps -ef | grep [do]cker

匹配一个范围内的任一字符

grep [a-z]c /etc/passwd

这里表示匹配一个小写字母的字符后面接一个字符 c 的字符串

结合 ^ 字符使用,表示取反

^ 放在方括号里面表示反向含义

^ 放在方括号外面则表示的是匹配行首

grep [^a-z]c /etc/passwd

这里表示匹配一个非小写字母的字符后接一个字符 c 的字符串

使用 {n.m} 区间表达式来匹配指定的次数

  • {n,m}表示匹配在其前面的字符 n 到 m次,
  • {n,} 表示至少匹配 n 次
  • {,m} 表示最多匹配 m 次
  • {n} 表示是精准匹配 n 次
  • 在 BRE 中,使用的是 {n,m} 的形式来实现相同的功能。
  • n 与 m 的值必须介于 0 至 RE_DUP_MAX(包含这个值)之间,后者的最小值为255
egrep 5{2} /etc/passwd

匹配/etc/passwd文件中,一行内5连续出现了2次的行

使用 ( ) 保存已匹配的字符

  • 使用 ( ) 会先匹配括号中的字符串,然后将匹配到的字符串保存在由正则表达式解析器预定义好的叫做寄存器的变量中,其编号从1到9,也就是说最多可以保存9组字符串,使用 \n 可以取出所保存的字符串,其中 n1到9,分别对应9个寄存器的值
ifconfig eth0 | egrep '([0-9]{,3}\.){3}[0-9]'

匹配一个行首字符和行尾字符相同的字符串

egrep '^(.).*\1$' test.txt
义好的叫做寄存器的变量中,其编号从1到9,也就是说最多可以保存9组字符串,使用 `\n` 可以取出所保存的字符串,其中 `n``1到9`,分别`对应9个寄存器的值`。

```shell
ifconfig eth0 | egrep '([0-9]{,3}\.){3}[0-9]'
posted @ 2022-02-19 23:33  月巴左耳东  阅读(104)  评论(0编辑  收藏  举报