linux 中 文本处理(sort uniq cut tr wc)命令

概要
  1. sort命令
  2. uniq命令
  3. cut命令
  4. tr命令
  5. wc命令
 
 
详细
 
1 sort命令
  • 将文件内容排序(仅显示排序,实际文件内容并未变化)
  • 参数
    • cat xxx | sort -n
      • # 依照数值的大小排序
    • cat xxx | sort -n -r
      • # 以相反的顺序来排序
    • cat xxx | sort -n -k数字
      • # 以某列进行排序
    • cat xxx | sort -n -k数字 -t '分隔符'
      • # 指定分割符,默认是以空格为分隔符
2 uniq命令
  • 与sort配合使用(仅显示无重复,实际文件内容未变)
  • cat xxx | sort | uniq -c # 在每列旁边显示该行重复出现的次数
  • cat xxx | sort | uniq -d # 仅显示重复出现的行列
  • cat xxx | sort | uniq -u # 仅显示出一次的行列
3 cut命令
  • cat xxx | cut -d '|' -f3
    • -d # 以某字符为分隔符,默认的字段分隔符为"TAB"
    • -f  # 显示文件中某列
4 tr命令
  • 替换文件字符(仅显示替换,实际文本并没有替换)
    • 如: cat xxx | tr 123 678
5 wc命令
  • 统计 文件某信息
    • cat xxx | wc -c 统计  文件的字节数
    • cat xxx | wc -l 统计   文件的行数
    • cat xxx | wc -w 统计 文件的单词数
  • Linux系统中,一段连续的数字或字母组合为一个词
 
---------
操作演示
---------
 
1 sort命令
 
默认
-n -r
-k
vim 中加竖杠
-t
 
 
2 uniq命令
 
-c 
-d
-u
 
3 cut命令
显示文件中某列
4 tr命令
一位对一位
 
5
统计 文件的字节数/行数/单词数
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
posted @ 2021-12-21 21:55  tslam  阅读(74)  评论(0编辑  收藏  举报