常用文本处理、统计工具
一:常用文本处理工具
cat 查看文本
- -n 显示行号
- -A 显示换行符
- -s 压缩连续的空行
- -E 显示行结束符
tac 反转显示文本列
rev 反转显示文本行
more 分页显示
less 分页浏览
head 显示文件的头
- -n # 显示前#行
- -c # 显示前多少字符
tail 显示文件的尾
- -n # 显示后#行
- -c # 显示后多少字符
- -f 跟踪文件变化
- -F 跟踪文件名,在文件名变化时提示
cut 以列为单位来取
- -d 指定分隔符,默认为tab
- -f 指定列号
- -c #-# 字符数
- --output-delimiter=STRING 指定输出分隔符
paste 俩个文件列纵向合并,cat !* 俩个文件列横向合并
- -d 指定分隔符
- -s 所有行合并为一行
二:常用文本统计工具
wc 行数,单词数,字节数
- -l 统计有多少行
- -c 字节
- -m 字符
- -w 单词
- -L 最长行的长度
sort 排序
- -t 指定分隔符
- -k 第几列排序
- -n 按数字排序
- -r 倒序
- -R 随机排序
- -u 去重
uniq 删除相邻的重复行合并一个行
- -c 显示有几个相邻的行合并成一个
- -u 仅显示不曾重复的行
diff 比较文件不同的行
- -u 输出“统一的(unified)”diff格式文件
patch 通过diff的不同之处可以还原原文件
- -b 恢复文件时备份旧文件,被恢复的文件会替换原文件