uniq和sort命令学习[已迁移]
转自:https://www.runoob.com/linux/linux-comm-uniq.html
1.uniq
Linux uniq 命令用于检查及删除文本文件中重复出现的行列,一般与 sort 命令结合使用。
uniq 可检查文本文件中重复出现的行列。
- -c或--count 在每列前显示该行重复出现的次数。(这个用的比较多吧?)
- -d或--repeated 仅显示重复出现的行列。
- -u或--unique 仅显示出一次的行列。
1.2.例子
testfile文件内容为:
$ cat testfile #原有内容 test 30 test 30 test 30 Hello 95 Hello 95 Hello 95 Hello 95 Linux 85 Linux 85
统计:
$ uniq -c testfile #删除重复行后的内容 3 test 30 #前面的数字的意义为该行共出现了3次 4 Hello 95 #前面的数字的意义为该行共出现了4次 2 Linux 85 #前面的数字的意义为该行共出现了2次
当重复的行并不相邻时,uniq 命令是不起作用的,可以结合sort来:
$ sort testfile1 | uniq -c 3 Hello 95 3 Linux 85 3 test 30
2.sort
https://www.cnblogs.com/51linux/archive/2012/05/23/2515299.html,这个写的超级详细。
cat aaa|awk '{print $9}'|grep -o '[0-9]*'|uniq -c|sort -n -r|head -n 10
- -n:依照数值的大小排序。(而不是按照字符串来排序);
- -r 以相反的顺序来排序。即从大到小,不加-r默认是从小到大的;
- -k field1[,field2] 按指定的列进行排序。默认是使用第一列来排序的。
- -t 指定排序时所用的栏位分隔字符。默认应该是空格。