Shell编程四剑客之GREP

      全面搜索正则表达式(Global search regular expression(RE) ,GREP)是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来。

       Unix/Linux的grep家族包括grep、egrep和fgrep,其中egrep和fgrep的命令跟grep有细微的区别,egrep是grep的扩展,支持更多的re元字符, fgrep是fixed grep或fast grep简写,它们把所有的字母都看作单词,正则表达式中的元字符表示其自身的字面意义,不再有其他特殊的含义,一般使用比较少。

       目前Linux操作系统默认使用GNU版本的grep。它功能更强,可以通过-G、-E、-F命令行选项来使用egrep和fgrep的功能。其语法格式及常用参数详解如下:

grep     -[acinv]    'word'     Filename

Grep常用参数详解如下:

-a                                       以文本文件方式搜索;

-c                                       计算找到的符合行的次数;

-i                                       忽略大小写;

-n                                      顺便输出行号;

-v                                      反向选择,即显示不包含匹配文本的所有行;

-h                                      查询多文件时不显示文件名;

-l                                       查询多文件时只输出包含匹配字符的文件名;

-s                                       不显示不存在或无匹配文本的错误信息;

-E                                      允许使用egrep扩展模式匹配。

学习Grep时,需要了解通配符、正则表达式两个概念,很多读者容易把彼此搞混淆,通配符主要用在Linux的Shell命令中,常用于文件或者文件名称的操作,而正则表达式用于文本内容中的字符串搜索和替换,常用在AWK、GREP、SED、VIM工具中对文本的操作。

通配符类型详解:

*                                        0个或者多个字符、数字;

?                                         匹配任意一个字符;

#                                        表示注解;

|                                         管道符号;

;                                         多个命令连续执行;

&                                       后台运行指令;

!                                         逻辑运算非;

[ ]                                       内容范围,匹配括号中内容;

{ }                                      命令块,多个命令匹配。

正则表达式详解:

*                                        前一个字符匹配0次或多次;

.                                         匹配除了换行符以外任意一个字符;

.*                                       代表任意字符;

^                                        匹配行首,即以某个字符开头;

$                                        匹配行尾,即以某个字符结尾;

\(..\)                                   标记匹配字符;

[]                                        匹配中括号里的任意指定字符,但只匹配一个字符;

[^]                                      匹配除中括号以外的任意一个字符;

\                                         转义符,取消特殊含义;

\<                                      锚定单词的开始;

\>                                      锚定单词的结束;

{n}                                     匹配字符出现n次;

{n,}                                 匹配字符出现大于等于n次;

{n,m}                                 匹配字符至少出现n次,最多出现m次;

\w                                      匹配文字和数字字符;

\W                                     \w的反置形式,匹配一个或多个非单词字符;

\b                                       单词锁定符;

\s                                        匹配任何空白字符;

\d                                       匹配一个数字字符,等价于[0-9]。

常用GREP工具企业演练案列:

grep  -c "test"           file.txt 统计test字符总行数;

grep  -i "TEST"        file.txt 不区分大小写查找TEST所有的行;

grep  -n "test"           file.txt 打印test的行及行号;

grep  -v "test"           file.txt 不打印test的行;

grep  "test[53]"         file.txt 以字符test开头,接5或者3的行;

grep  "^[^test]"         file.txt 显示输出行首不是test的行;

grep  "[Mm]ay"          file.txt 匹配M或m开头的行;

grep  "K…D"              file.txt 匹配K,三个任意字符,紧接D的行;

grep  "[A-Z][9]D"       file.txt 匹配大写字母,紧跟9D的字符行;

grep  "T\{2,\}"          file.txt 打印字符T字符连续出现2次以上的行;

grep  "T\{4,6\}"        file.txt 打印字符T字符连续出现4次及6次的行;

grep  -n "^$"               file.txt 打印空行的所在的行号;

grep  -vE "#|^$"       file.txt    不匹配文件中的#和空行;

grep   --color -ra -E    "db|config|sql"  *  匹配包含db或者config或者sql的文件;

grep   --color -E "\<([0-9]{1,3}\.){3}([0-9]{1,3})\>"    file.txt 匹配IPV4地址。

posted @ 2019-10-24 10:36  走天涯123  阅读(139)  评论(0编辑  收藏  举报