文本处理器 - wc cut sort uniq
wc
word count统计文本文件中的字符个数
用法: wc filename
行数 字符个数 文件大小 (字节) 文件名
-l
-w
-c
cut
用来做文件分隔
-d 指定分隔符(delimiter)
-d[ :]不行
-f 指定输出的列数据:
-f2
-f1-3
-f1,3
--output-delimiter='xx'
[cut的局限性:1、-d指定分隔符,不能同时指定多个2、不能做高级的格式化输出;所以我要熟练掌握awk]
sort
排序,默认查看第一个字符(包括数字字母以及空格和特殊字符),以ASCII码来排序(大小写不是)
-f 忽略大小写的差异, 例如A与a视为编码相同;
-b忽略最前面的空格符部分;
-M以月份的名字来排序,例如JAN DEC等等的排序方法;
-n使用纯数字进行排序,默认是以文件形态来排序的;
-r反向排序;
-u就是uniq,相同的数据中,仅出现一行代表;
-t分隔符,默认是用tab键分割;
-k以那个区间(field)来进行排序的意思
uniq
连续且相同的命令,才被视为重复
建议,先排序,后去重
tar 归档-》 对目录
-c统计某些字符重复次数(重要)
sort filename | uniq -c