文本处理工具 – wc,cut,sort,uniq

wc命令:

word count 统计文本中的字符个数
-l:行数
-w:单词数
-c:字节数

cut命令:
用来做文件分隔
-d DELIMETER:指明分隔符;
-f 指定输出的数据
#:第#个字段
#,#[,#]:离散的多个字段,例如1,3,6
#-#:连续多个字段,例如1-6
混合使用:1-3,7
--output-delimiter=‘xx’:指定以什么字符串输出;

sort命令:

排序,默认查看第一个字符(包括数字字母以及空格和特殊符号),以ASCII码来排序
-f:忽略字符的大小写
-r:逆序
-t DELIMETER:指定字段分隔符;
-k #:以指定的字段为标准排序;
-n:以数值大小进行排序
-u:uniq,排序后去重;

uniq命令:
连续且相同的命令,才被视为重复
-d, --repeated:仅显示重复的行;
-u, --unique:仅显示不曾重复的行;

*   -c, --count:统计某些字符重复的次数

sort FINENAME | uniq -c

 

posted @ 2019-08-13 09:58  Azuressy  阅读(154)  评论(0编辑  收藏  举报