『学了就忘』Linux基础命令 — 31、grep命令和通配符
1、grep命令介绍
grep
命令:是一个Shell命令,是Shell中文本三剑客之一,作用是在文件中提取和匹配符合条件的字符串行。
grep
命令是一个非常常见的命令,和find
命令有很多非常相似的地方,所以在这里先说明。
grep
命令格式如下:
[root@localhost ~ ]# grep [选项] “搜索内容” 文件名
选项:
-i:忽略大小写
-n:输出行号(显示原始文件中的行号)
-v:反向查找
--color=auto:搜索出的关键字用颜色显示
举例:
# 输出行号。
[root@localhost ~]# grep -n"123" abc
3:123abc
4:123abcdef123
5:abc 123
6:123aaaaabc
7:123bc
8:123aabc
10:abc123abc
# 把你要搜索的内容用红色高亮显示。
[root@localhost ~]# grep --color=auto "123" abc
注意:如果要搜索的内容中没有空格,“搜索内容”部分就可以不加双引号,如果“搜索内容”中有空格,则一定要加双引号。
2、find命令和grep命令的区别(重点)
(1)find命令
find
命令用于在系统中搜索符合条件的文件名,如果需要模糊查询,则使用通配符进行匹配,通配符是完全匹配。
提示:
find
命令可以通过-regex
选项,把匹配规则转为正则表达式规则,但是不建议如此。
(2)grep命令
grep
命令用于在文件中搜索符合条件的字符串,如果需要模糊查询,则使用正则表达式进行匹配,正则表达式是包含匹配。
注意:完全匹配和包含匹配的规则不是
find
命令和grep
命令的区别,是通配符和正则表达式的区别。
3、通配符与正则表达式的区别
(1)通配符:
用于匹配文件名,是完全匹配。
下面举例说明:
?
:匹配一个任意字符。*
:匹配0个或任意多个任意字符,也就是可以匹配任何内容。[]
:匹配中括号中任意一个字符。例如:[abc]
代表一定匹配一个字符,或者是a
,或者是b
,或者是c
。[-]
:匹配中括号中任意一个字符,-
代表一个范围。例如:[a-z]
代表匹配一个小写字母。[\^]
:逻辑非,表示匹配不是中括号内的一个字符。例如:[\^0-9]
代表匹配一个不是数字的字符。
# 通过通配符查找文件
[root@localhost ~ ] # find . -name "abc*"
./abcd
./abc
[root@localhost ~ ]# find . -name "a?c"
./acc
./abc
# 其他同理
提示:只要是操作文件名或者目录名的命令都可以是用通配符。如
rm
命令。
(2)正则表达式:
用于匹配字符串,是包含匹配。
下面简单举例:
?
:匹配前一个字符重复0次,或1次(?
是扩展正则,需要使用egrep
命令。注Shell分为标准正则和扩展正则。)。*
:匹配前一个字符重复0次,或任意多次。[]
:匹配中括号中任意一个字符。例如:[abc]
代表一定匹配一个字符,或者是a
,或者是b
,或者是c
。[-]
:匹配中括号中任意一个字符,-
代表一个范围。例如:[a-z]
代表匹配一个小写字母。[\^]
:逻辑非,表示匹配不是中括号内的一个字符。例如:[\^0-9]
代表匹配一个不是数字的字符。^
:匹配行首(限位符)。$
:匹配行尾(限位符)。
其中主要是是?
和*
,在通配符和正则表达式的不同。
关于
*
注意:
[root@localhost ~ ] # grep "a*" abc
向上面命令中,单写一个字母+*
是没有任何意义的。结果会显示文件中所有内容,包括空白行。
因为*
是匹配前一个字符重复0次,或任意多次。0次代表什么都没有,也就是没有条件的筛选,所以就显示文件汇总所有的内容。而
[root@localhost ~ ] # grep "aa*" abc
命令,则表示查找文件中包含有小写字母a
的行。和开头无关,正则是含有匹配,包含就会被列出。
如果想要在正则当中去匹配开头的内容,就需要使用限位符。如下:
[root@localhost ~] # grep "^a" abc
abc
abc 123
abc123abc
[root@localhost ~] # grep "^aa*" abc 和上面查询结果也一样。
小练习:
[root@localhost ~]# egrep"aaa?" abc
123aaaaabc
123aabc
# 上面证明是包含匹配
[root@localhost ~j# egrep "3aaa?b"abc
123aabc
[root@localhost ]#
# 如果只想要搜索两个a的字符串,就需要使用限位符,其中的3和b都属于限位符。
# 限位符是包括自己与其他字符串不匹配的任何字符的统称。