Shell编程四剑客之GREP

全面搜索正则表达式（Global search regular expression(RE) ，GREP）是一种强大的文本搜索工具，它能使用正则表达式搜索文本，并把匹配的行打印出来。

Unix/Linux的grep家族包括grep、egrep和fgrep，其中egrep和fgrep的命令跟grep有细微的区别，egrep是grep的扩展，支持更多的re元字符， fgrep是fixed grep或fast grep简写，它们把所有的字母都看作单词，正则表达式中的元字符表示其自身的字面意义，不再有其他特殊的含义，一般使用比较少。

目前Linux操作系统默认使用GNU版本的grep。它功能更强，可以通过-G、-E、-F命令行选项来使用egrep和fgrep的功能。其语法格式及常用参数详解如下：

grep -[acinv] 'word' Filename

Grep常用参数详解如下：

-a 以文本文件方式搜索;

-c 计算找到的符合行的次数;

-i 忽略大小写;

-n 顺便输出行号;

-v 反向选择，即显示不包含匹配文本的所有行;

-h 查询多文件时不显示文件名;

-l 查询多文件时只输出包含匹配字符的文件名;

-s 不显示不存在或无匹配文本的错误信息;

-E 允许使用egrep扩展模式匹配。

学习Grep时，需要了解通配符、正则表达式两个概念，很多读者容易把彼此搞混淆，通配符主要用在Linux的Shell命令中，常用于文件或者文件名称的操作，而正则表达式用于文本内容中的字符串搜索和替换，常用在AWK、GREP、SED、VIM工具中对文本的操作。

通配符类型详解：

* 0个或者多个字符、数字;

? 匹配任意一个字符;

# 表示注解;

| 管道符号;

; 多个命令连续执行;

& 后台运行指令;

! 逻辑运算非;

[ ] 内容范围，匹配括号中内容;

{ } 命令块，多个命令匹配。

正则表达式详解：

* 前一个字符匹配0次或多次;

. 匹配除了换行符以外任意一个字符;

.* 代表任意字符;

^ 匹配行首，即以某个字符开头;

$ 匹配行尾，即以某个字符结尾;

$..$ 标记匹配字符;

[] 匹配中括号里的任意指定字符，但只匹配一个字符;

[^] 匹配除中括号以外的任意一个字符;

\ 转义符，取消特殊含义;

\< 锚定单词的开始;

\> 锚定单词的结束;

{n} 匹配字符出现n次;

{n,} 匹配字符出现大于等于n次;

{n,m} 匹配字符至少出现n次，最多出现m次;

\w 匹配文字和数字字符;

\W \w的反置形式，匹配一个或多个非单词字符;

\b 单词锁定符;

\s 匹配任何空白字符;

\d 匹配一个数字字符，等价于[0-9]。

常用GREP工具企业演练案列：

grep -c "test" file.txt 统计test字符总行数;

grep -i "TEST" file.txt 不区分大小写查找TEST所有的行;

grep -n "test" file.txt 打印test的行及行号;

grep -v "test" file.txt 不打印test的行;

grep "test[53]" file.txt 以字符test开头，接5或者3的行;

grep "^[^test]" file.txt 显示输出行首不是test的行;

grep "[Mm]ay" file.txt 匹配M或m开头的行;

grep "K…D" file.txt 匹配K，三个任意字符，紧接D的行;

grep "[A-Z][9]D" file.txt 匹配大写字母，紧跟9D的字符行;

grep "T\{2,\}" file.txt 打印字符T字符连续出现2次以上的行;

grep "T\{4,6\}" file.txt 打印字符T字符连续出现4次及6次的行;

grep -n "^$" file.txt 打印空行的所在的行号;

grep -vE "#|^$" file.txt 不匹配文件中的#和空行;

grep --color -ra -E "db|config|sql" * 匹配包含db或者config或者sql的文件;

grep --color -E "\<([0-9]{1,3}\.){3}([0-9]{1,3})\>" file.txt 匹配IPV4地址。

posted @ 2019-10-24 10:36 走天涯123 阅读(139) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

走天涯123

Shell编程四剑客之GREP

公告