文本处理命令(sort、uniq、tr、cut、split、eval)
文本处理命令
sort命令
以行为单位对文本内容进行排序,也可以根据不同的数据类型来排序比较原则是从首字符向后,一次按照ASCII码进行比较,最后将他们按照升序输出。
格式:
sort [选项] 参数
一帮配合管道符进行使用
cat [文件] | sort [选项]
常用选项:
-n | 按照数字进行排序 |
---|---|
-r | 反向排序 |
-u | 等同于uniq,表示相同的数据仅显示一行 |
-t | 指定字段分隔符,默认使用[Tab]键分隔一般与-k选项一起用 |
-k | 指定排序字段一般与-t选项一起用 |
-o<输出文件> | 将排序后的结果转存至指定文件 |
-f | 忽略大小写,会将小写字母都转换为大写字母来进行比较 |
-b | 忽略每行前面的空格 |
示例:
uniq命令
用于报告或者忽略文件中连续重复的行,常与sort命令结合使用
语法格式
uniq [选项] 参数
一帮配合管道符进行使用
cat [文件] | uniq [选项]
常用选项:
-c | 进行计数并删除文件中重复的行 |
---|---|
-d | 仅显示连续重复的行 |
-u | 仅显示出现一次的行( 这里注意指的不是文件内仅出现一次的行,而是没有连续重复的行) |
示例:
tr命令
常用来对标准输入的字符进行替换
格式:
tr [选项] [参数]
常用选项:
-c | 保留字符集1的字符,其他的字符用(包括换行符\n)字符集2替换 |
---|---|
-d | 删除所有属于字符集1的字符 |
-s | 将重复出现的字符串压缩为一个字符串;用字符集2 替换 字符集1 |
-t | 字符集2 替换 字符集1,不加选项同结果 |
示例:
cut命令
显示行中的指定部分,删除文件中指定字段
格式:
cut [选项] 参数
也可以配合管道符进行使用
cat [文件] | cut 选项
常用选项:
-f | 通过指定哪一个字段进行提取。cut命令使用“TAB”作为默认的字段分割符 |
---|---|
-d | “TAB”是默认的分隔符,使用此选项可更改为其他的分隔符 |
- -complement | 用于排除所指定的字段 |
- -output-delimiter= | 更改输出内容的分隔符 |
示例:
split命令
将一个大的文件拆分成若干个小文件
格式:
split 选项 参数 原始文件 拆分后文件前缀名
常用选项:
-l | 以行数差分 |
---|---|
-b | 以大小差分 |
eval命令
命令字前加上eval时,shell会在执行命令之前扫描它两次。eval命令将首先会先扫描命令行进行所有的置换,然后再执行该命令。该命令适用于那些一次扫描无法实现其功能的变量。该命令对变量进行两次扫描。
示例: