linux——高级文本处理命令之wc、cut、sort
1. wc :Word Count
命令的功能为统计指定文件中的字节数、字数、行数,并将统计结果显示输出
1.1 命令格式:
wc [选项]文件...
1.2 命令参数:
-c 统计字节数。
-l 统计行数。
-m 统计字符数。这个标志不能与 -c 标志一起使用。
-w 统计字数。一个字被定义为由空白、跳格或换行字符分隔的字符串。
-L 打印最长行的长度。
2、cut:以某种方式按照文件的行进行分割
-b :以字节为单位进行分割。这些字节位置将忽略多字节字符边界,除非也指定了 -n 标志。
-c :以字符为单位进行分割。
-d :自定义分隔符,默认为制表符。
-f :与-d一起使用,指定显示哪个区域。
-n :取消分割多字节字符。仅和 -b 标志一起使用。如果字符的最后一个字节落在由 -b 标志的 List 参数指示的<br />范围之内,
该字符将被写出;否则,该字符将被排除。
1 [zyk@localhost shell]$ echo $PATH
2 /usr/local/bin:/usr/bin:/usr/local/sbin:/usr/sbin:/root/apps/jdk1.8.0_191/bin:/home/zyk/.local/bin:/home/zyk/bin
分割符为:,取第一个字符串
3 [zyk@localhost shell]$ echo $PATH | cut -d ":" -f 1
4 /usr/local/bin
分隔符为:,取1到5这5个字符串
5 [zyk@localhost shell]$ echo $PATH | cut -d ":" -f 1-5
6 /usr/local/bin:/usr/bin:/usr/local/sbin:/usr/sbin:/root/apps/jdk1.8.0_191/bin
分隔符为:,取1到5和6这6个字符串
7 [zyk@localhost shell]$ echo $PATH | cut -d ":" -f 1-2,5
8 /usr/local/bin:/usr/bin:/root/apps/jdk1.8.0_191/bin
3. sort:将文本文件内容加以排序
sort可针对文本文件的内容,以行为单位来排序
1 -b 忽略每行前面开始出的空格字符。
2 -c 检查文件是否已经按照顺序排序。
3 -d 排序时,处理英文字母、数字及空格字符外,忽略其他的字符。
4 -f 排序时,将小写字母视为大写字母。
5 -i 排序时,除了040至176之间的ASCII字符外,忽略其他的字符。
6 -m 将几个排序好的文件进行合并。
7 -M 将前面3个字母依照月份的缩写进行排序。
8 -n 依照数值的大小排序。
9 -o<输出文件> 将排序后的结果存入指定的文件。
10 -r 以相反的顺序来排序。
11 -t<分隔字符> 指定排序时所用的栏位分隔字符。
12 +<起始栏位>-<结束栏位> 以指定的栏位来排序,范围由起始栏位到结束栏位的前一栏位。
t 以":"先分割,k 按每行的第三个比较,n 是数字比较,r 倒序
https://blog.csdn.net/z1164072826/article/details/81056872
4. sed :面向字符流的非交互式编辑器
https://www.cnblogs.com/wangqiguo/p/6718512.html
5. awk:强大的文本分析工具
https://www.cnblogs.com/xiaoleiel/p/8349487.html