Linux常用统计命令

排序:sort

去除重复:uniq

字符统计:wc

1.sort

(1)简介

  • Linux sort 命令用于将文本文件内容加以排序。
  • sort 可针对文本文件的内容,以行为单位来排序。

(2)sort常用参数

  • -b:忽略开头的空白字符
  • -f:将小写字母看作大写字母
  • -h:根据存储容量排序(KB、MB、GB)
  • -n:按数字排序
  • -o:把结果写入文件
  • -r:以相反的顺序来排序
  • -t:指定分隔符。默认为空格
  • -V:按照数字版本排序
  • -k:指定排序的关键字,与-t参数配合使用

sort:不加任何参数,默认按照每行第一位大小排序

sort -n:按照每行数字排序

sort -h:按照存储容量排序

sort -hr:按照存储容量排序后反转

 

 -o:将结果保存至文件中

 cat sort_t|sort -t . -k 1:指定分隔符.,然后按照第一列顺序排列

 cat sort_t|sort -t . -k 2:指定分隔符.,然后按照第二列顺序排列

 -V:按照版本排序

2.uniq

(1)简介:

  • 以行为单位,进行行与行之间的字符串比较并进行去重
  • 只能对有序的文本行进行有效去重,所以常与sort命令结合使用

(2)uniq常用参数(只检查上下行是否重复)

  • -c:统计重复出现的次数
  • -d:所有邻近的重复行只被打印一次。重复次数要>=2次
  • -D:所有邻近的重复行将全部打印
  • -f:跳过对前n个列的比较
  • -s:跳过对前n个字符的比较
  • -w:只对每行前n个字符进行比较

-c:统计出现重复次数,前方一列展示重复的次数

cat sort_h.txt|sort -n|uniq -c -w 2

 对前2字符进行去重比较

3.wc

(1)简介

  • Linux wc命令用于计算字数。
  • 利用wc指令我们可以计算文件的Byte数、字数、或是列数,若不指定文件名称、或是所给予的文件名为"-",则wc指令会从标准输入设备读取数据。

(2)wc常用参数:

  • -c:统计字节数:chars
  • -l:统计行数
  • -w:统计单词数
  • -L:打印最长行的长度

wc:文本的行数为4、单词数4、字节数21(包含了换行符)

 

posted @ 2022-05-02 11:38  SpongeD  阅读(1097)  评论(0编辑  收藏  举报