linux 中 文本处理(sort uniq cut tr wc)命令
概要
-
sort命令
-
uniq命令
-
cut命令
-
tr命令
-
wc命令
详细
1 sort命令
-
将文件内容排序(仅显示排序,实际文件内容并未变化)
-
参数
-
cat xxx | sort -n
-
# 依照数值的大小排序
-
cat xxx | sort -n -r
-
# 以相反的顺序来排序
-
cat xxx | sort -n -k数字
-
# 以某列进行排序
-
cat xxx | sort -n -k数字 -t '分隔符'
-
# 指定分割符,默认是以空格为分隔符
2 uniq命令
-
与sort配合使用(仅显示无重复,实际文件内容未变)
-
cat xxx | sort | uniq -c # 在每列旁边显示该行重复出现的次数
-
cat xxx | sort | uniq -d # 仅显示重复出现的行列
-
cat xxx | sort | uniq -u # 仅显示出一次的行列
3 cut命令
-
cat xxx | cut -d '|' -f3
-
-d # 以某字符为分隔符,默认的字段分隔符为"TAB"
-
-f # 显示文件中某列
4 tr命令
-
替换文件字符(仅显示替换,实际文本并没有替换)
-
如: cat xxx | tr 123 678
5 wc命令
-
统计 文件某信息
-
cat xxx | wc -c 统计 文件的字节数
-
cat xxx | wc -l 统计 文件的行数
-
cat xxx | wc -w 统计 文件的单词数
-
Linux系统中,一段连续的数字或字母组合为一个词
---------
操作演示
---------
1 sort命令
默认
-n -r
-k
vim 中加竖杠
-t
2 uniq命令
-c
-d
-u
3 cut命令
显示文件中某列
4 tr命令
一位对一位
5
统计 文件的字节数/行数/单词数