cut sort uniq wc 一 文本处理工具

欢迎光临我的博客[http://poetize.cn],前端使用Vue2,聊天室使用Vue3,后台使用Spring Boot

cut

cut是一个选取命令,就是将一段数据经过分析,取出我们想要的。
一般来说,选取信息通常是针对“行”来进行分析的,并不是整篇信息分析的。


-c :
	以字符为单位进行分割。

	cut -c1-3 test.txt:打印第1个到第3个字符
	cut -c5- test.txt:打印从第5个字符开始到结尾

-d :
	自定义分隔符,默认为制表符。

	cut -d';' -f 1

-f :
	用-d将文本分隔成一段一段后,-f用来取出第几段

	cut -f1 test.txt:取出一行分割后的第一个

	cut -f2,3 test.txt:取出一行分割后的第2到3个

sort

sort将文件的每一行作为一个单位,相互比较。
比较原则是从首字符向后,依次按ASCII码值进行比较,最后将他们按升序输出。

-u : 
	它的作用很简单,就是在输出行中去除重复行。

-r : 
	sort默认的排序方式是升序,如果想改成降序,就加个-r就搞定了。

-n : 
	以数值来进行排序。

-f : 
	忽略大小写


cat ld | sort -n

uniq

uniq命令可以在排序后处理重复的行。

常用选项:

-i
	忽略大小写

-c
	在行的开头输出该行出现的次数

-d
	只输出重复的行

-u
	只输出出现过一次的行


sort -n ld | uniq -c

wc

wc统计文件里面有多少单词,多少行,多少字符。

-l
	仅列出行;

-w
	仅列出多少字(英文单字);

-m
	多少字符;
posted @ 2019-10-04 11:27  LittleDonkey  阅读(183)  评论(0编辑  收藏  举报