Linux常用统计命令
排序:sort
去除重复:uniq
字符统计:wc
1.sort
(1)简介
- Linux sort 命令用于将文本文件内容加以排序。
- sort 可针对文本文件的内容,以行为单位来排序。
(2)sort常用参数
- -b:忽略开头的空白字符
- -f:将小写字母看作大写字母
- -h:根据存储容量排序(KB、MB、GB)
- -n:按数字排序
- -o:把结果写入文件
- -r:以相反的顺序来排序
- -t:指定分隔符。默认为空格
- -V:按照数字版本排序
- -k:指定排序的关键字,与-t参数配合使用
sort:不加任何参数,默认按照每行第一位大小排序
sort -n:按照每行数字排序
sort -h:按照存储容量排序
sort -hr:按照存储容量排序后反转
-o:将结果保存至文件中
cat sort_t|sort -t . -k 1:指定分隔符.,然后按照第一列顺序排列
cat sort_t|sort -t . -k 2:指定分隔符.,然后按照第二列顺序排列
-V:按照版本排序
2.uniq
(1)简介:
- 以行为单位,进行行与行之间的字符串比较并进行去重
- 只能对有序的文本行进行有效去重,所以常与sort命令结合使用
(2)uniq常用参数(只检查上下行是否重复)
- -c:统计重复出现的次数
- -d:所有邻近的重复行只被打印一次。重复次数要>=2次
- -D:所有邻近的重复行将全部打印
- -f:跳过对前n个列的比较
- -s:跳过对前n个字符的比较
- -w:只对每行前n个字符进行比较
-c:统计出现重复次数,前方一列展示重复的次数
cat sort_h.txt|sort -n|uniq -c -w 2
对前2字符进行去重比较
3.wc
(1)简介
- Linux wc命令用于计算字数。
- 利用wc指令我们可以计算文件的Byte数、字数、或是列数,若不指定文件名称、或是所给予的文件名为"-",则wc指令会从标准输入设备读取数据。
(2)wc常用参数:
- -c:统计字节数:chars
- -l:统计行数
- -w:统计单词数
- -L:打印最长行的长度
wc:文本的行数为4、单词数4、字节数21(包含了换行符)