1 wc 命令

wc 命令是一个统计的工具,主要用来显示文件所包含的行、字和字节数。

wc 命令是 word count 的缩写。

(1)命令格式

wc [选项] [文件]

(2)常用参数

参数描述
-c 统计字节数
-l 统计行数
-m 统计字符数,这个标志不能与 -c 标志一起使用
-w 统计字数,一个字被定义为由空白、跳格或换行字符分隔的字符串
-L 打印最长行的长度

 

2 grep 命令

grep 是个很强大的命令,用来找到文件中的匹配文本,并且能够接受正则表达式和通配符,同时可以用多个 grep 命令选项来生成各种格式的输出。

grep 的工作方式是这样的,它在一个或多个文件中搜索字符串模板。如果模板包括空格,则必须被引用,模板后的所有字符串被看作文件名。搜索的结果被送到标准输出,不影响原文件内容。

grep 可用于 shell 脚本,因为 grep 通过返回一个状态值来说明搜索的状态,如果模板搜索成功,则返回 0,如果搜索不成功,则返回 1,如果搜索的文件不存在,则返回 2。我们利用这些返回值就可进行一些自动化的文本处理工作。

(1)命令格式

grep [选项] pattern [file]

(2)常用参数

参数描述
-c 计算找到 '搜寻字符串'(即 pattern) 的次数
-i 忽略大小写的不同,所以大小写视为相同
-n 输出行号
-v 反向选择,打印不匹配的行
-r 递归搜索
--color=auto 将找到的关键词部分加上颜色显示

 

3 cut 命令

cut 命令是一个将文本按列进行切分的小工具,它可以指定分隔每列的定界符。

如果一行数据包含多个字段(多列),现在想要提取其中的一列或多列,这是 cut 命令就可以大显身手了。

(1)命令格式

cut [选项] [文件名]

(2)常用参数

参数描述
-b 以字节为单位进行分割
-c 以字符为单位进行分割
-d 自定义分隔符,默认为制表符
-f 自定义字段
--complement 抽取整个文本行,除了那些由 -c 或 -f 选项指定的文本

 

4 paste 命令

paste 命令的功能正好与 cut 相反。它会添加一个或多个文本列到文件中,而不是从文件中抽取文本列。它通过读取多个文件,然后把每个文件中的字段整合成单个文本流,输入到标准输出。

(1)命令格式

paste [选项] [文件名]

(2)常用参数

参数描述
-s 将每个文件合并成行而不是按行粘贴
-d 自定义分隔符,默认为制表符

 

5 tr 命令

tr 命令常被用来更改字符。我们可以把它看作是一种基于字符的查找和替换操作。换字是一种把字符从一个字母转换为另一个字母的过程。tr 从标准输入中替换、缩减和/或删除字符,并将结果写到标准输出。

tr 只能通过 stdin(标准输入),而无法通过命令行参数来接受输入。

tr 是 translate(转换)的缩写。

(1)命令格式

tr [选项] SET1 SET2

将来自 stdin 的输入字符从 SET1 映射到 SET2,并将其输出写入 stdout(标准输出)。SET1 和 SET2 是字符类或字符集。如果两个字符集的长度不相等,那么 SET2 会不断重复其最后一个字符,直到长度与 SET1 相同。如果 SET2 的长度大于 SET1,那么在 SET2 中超出 SET1 的那部分字符则全部被忽略。

(2)常用参数

参数描述
-d 删除匹配 SET1 的内容,并不作替换