Linux操作命令(六)1.wc命令 2.grep命令 3.正则表达式
1、wc 命令是一个统计的工具,主要用来显示文件所包含的字节数、行数、字符数
参数 | 描述 |
---|---|
-c | 统计字节数 |
-l | 统计行数 |
-m | 统计字符数,这个标志不能与 -c 标志一起使用 |
-w | 统计字数,一个字被定义为由空白、跳格或换行字符分隔的字符串 |
-L | 打印最长行的长度 |
常用范例
统计文件的字节数、行数和字符数:
wc -c c.txt
wc -l c.txt
wc -m c.txt
统计文件的字节数、行数和字符数,只打印数字,不打印文件名:
cat c.txt | wc -c
cat c.txt | wc -l
cat c.txt | wc -m
统计/bin
目录下的命令个数
ls /bin | wc -l
2、grep 命令
grep命令用于在文本文件中查找指定的字符串
用来找到文件中的匹配文本,并且能够接受正则表达式和通配符,同时可以用多个 grep 命令选项来生成各种格式的输出
grep 的工作方式,它在一个或多个文件中搜索字符串模板。如果模板包括空格,则必须被引用,模板后的所有字符串被看作文件名。搜索的结果被送到标准输出,不影响原文件内容
grep 可用于 shell 脚本,因为 grep 通过返回一个状态值来说明搜索的状态,如果模板搜索成功,则返回 0,如果搜索不成功,则返回 1,如果搜索的文件不存在,则返回 2。我们利用这些返回值就可进行一些自动化的文本处理工作
1. 搜索指定的字符串:
grep "string" file.txt
2. 搜索多个文件中的指定字符串: grep "string" file1.txt file2.txt
3. 搜索目录中的所有文件: grep "string" /path/to/dir/*
4. 搜索指定文件类型中的字符串: grep "string" *.txt
5. 搜索字符串并显示行号: grep -n "string" file.txt
6. 搜索字符串并显示匹配行前后的内容: grep -C 2 "string" file.txt
7. 使用正则表达式搜索字符串: grep -E "pattern" file.txt
8. 搜索除指定字符串外的所有行: grep -v "string" file.txt
常用参数
参数 | 描述 |
---|---|
-c | 计算找到‘搜寻字符串’(即 pattern)的次数 |
-i | 忽略大小写的不同,所以大小写视为相同 |
-n | 输出行号 |
-v | 反向选择,打印不匹配的行 |
-r | 递归搜索 |
--color=auto | 将找到的关键词部分加上颜色显示 |
将/etc/passwd
文件中出现 root 的行取出来,关键词部分加上颜色显示
grep "root" /etc/passwd --color=auto
cat /ect/passwd | grep "root" --color=auto
将/etc/passwd
文件中没有出现 root 和 nologin 的行取出来
cat /etc/passwd | grep -v "root" | grep -v "nologin"
grep -v "root" /etc/passwd | grep -v "nologin"
在当前目录下递归搜索文件中包含 main() 的文件,经常用于查找某些函数位于哪些源代码文件中:grep -r “main”
2、正则表达式与 grep 命令
正则表达式是一种符号表示法,被用来识别文本模式。
正则表达式元字符由以下字符组成:
^
$
.
[
]
{
}
-
?
*
+
(
)
|
\
验证固定电话,打印符合条件的电话,固定电话格式基本都是带有 0 的区号+连接符“-”+电话号码,另外还有可能有分机号,区号有 3 位、4 位,电话号码有 7 位和 8 位的
grep -E "^0[0-9]{2,3}-[0-9]{7,8}(-[0-9]{3,4})?$" telphone.txt
区号:前面一个 0,后面跟 2-3 位数字 0[0-9]{2,3}
电话号码:7-8 位数字 [0-9]{7,8}
分机号:一般都是 3-4 位数字 [0-9]{3,4}
注意执行下面的命令时没有任何匹配输出,这是因为没有加 -E 选项,那例一没加为什么可以呢,这是因为 grep 把.
当成 shell 通配符,不是正则表达式的元字符