文本处理命令(sort、uniq、tr、cut、split、eval)

文本处理命令

以行为单位对文本内容进行排序，也可以根据不同的数据类型来排序比较原则是从首字符向后，一次按照ASCII码进行比较，最后将他们按照升序输出。

格式：
sort [选项] 参数
一帮配合管道符进行使用
cat [文件] | sort [选项]

常用选项：

-n	按照数字进行排序
-r	反向排序
-u	等同于uniq，表示相同的数据仅显示一行
-t	指定字段分隔符，默认使用[Tab]键分隔一般与-k选项一起用
-k	指定排序字段一般与-t选项一起用
-o<输出文件>	将排序后的结果转存至指定文件
-f	忽略大小写，会将小写字母都转换为大写字母来进行比较
-b	忽略每行前面的空格

示例：

用于报告或者忽略文件中连续重复的行，常与sort命令结合使用

语法格式
uniq [选项] 参数
一帮配合管道符进行使用
cat [文件] | uniq [选项]

常用选项：

-c	进行计数并删除文件中重复的行
-d	仅显示连续重复的行
-u	仅显示出现一次的行（这里注意指的不是文件内仅出现一次的行，而是没有连续重复的行）

示例：

常用来对标准输入的字符进行替换

格式：
tr [选项] [参数]

常用选项：

-c	保留字符集1的字符，其他的字符用（包括换行符\n）字符集2替换
-d	删除所有属于字符集1的字符
-s	将重复出现的字符串压缩为一个字符串；用字符集2 替换字符集1
-t	字符集2 替换字符集1，不加选项同结果

示例：

显示行中的指定部分，删除文件中指定字段

格式：
cut [选项] 参数
也可以配合管道符进行使用
cat [文件] | cut 选项

常用选项：

-f	通过指定哪一个字段进行提取。cut命令使用“TAB”作为默认的字段分割符
-d	“TAB”是默认的分隔符，使用此选项可更改为其他的分隔符
- -complement	用于排除所指定的字段
- -output-delimiter=	更改输出内容的分隔符

示例：

将一个大的文件拆分成若干个小文件

格式：
split  选项  参数  原始文件  拆分后文件前缀名

常用选项：

-l	以行数差分
-b	以大小差分

命令字前加上eval时，shell会在执行命令之前扫描它两次。eval命令将首先会先扫描命令行进行所有的置换，然后再执行该命令。该命令适用于那些一次扫描无法实现其功能的变量。该命令对变量进行两次扫描。

示例：

posted @ 2022-04-15 22:52 GENGBO 阅读(213) 评论(0) 收藏举报

刷新页面返回顶部