linux——高级文本处理命令之wc、cut、sort

1.  wc :Word Count

  命令的功能为统计指定文件中的字节数、字数、行数,并将统计结果显示输出

  1.1 命令格式:

    wc [选项]文件...

  1.2 命令参数: 

    -c 统计字节数。

    -l 统计行数。

    -m 统计字符数。这个标志不能与 -c 标志一起使用。

    -w 统计字数。一个字被定义为由空白、跳格或换行字符分隔的字符串。

    -L 打印最长行的长度。

    

 

 

2、cut:以某种方式按照文件的行进行分割

  -b :以字节为单位进行分割。这些字节位置将忽略多字节字符边界,除非也指定了 -n 标志。
  -c :以字符为单位进行分割。
  -d :自定义分隔符,默认为制表符。
  -f  :与-d一起使用,指定显示哪个区域。
  -n :取消分割多字节字符。仅和 -b 标志一起使用。如果字符的最后一个字节落在由 -b 标志的 List 参数指示的<br />范围之内,
该字符将被写出;否则,该字符将被排除。
1 [zyk@localhost shell]$ echo $PATH
2 /usr/local/bin:/usr/bin:/usr/local/sbin:/usr/sbin:/root/apps/jdk1.8.0_191/bin:/home/zyk/.local/bin:/home/zyk/bin
分割符为:,取第一个字符串
3 [zyk@localhost shell]$ echo $PATH | cut -d ":" -f 1 4 /usr/local/bin
分隔符为:,取1到5这5个字符串
5 [zyk@localhost shell]$ echo $PATH | cut -d ":" -f 1-5 6 /usr/local/bin:/usr/bin:/usr/local/sbin:/usr/sbin:/root/apps/jdk1.8.0_191/bin
分隔符为:,取1到5和6这6个字符串
7 [zyk@localhost shell]$ echo $PATH | cut -d ":" -f 1-2,5 8 /usr/local/bin:/usr/bin:/root/apps/jdk1.8.0_191/bin

 

3. sort:将文本文件内容加以排序

  sort可针对文本文件的内容,以行为单位来排序

 1   -b   忽略每行前面开始出的空格字符。
 2   -c   检查文件是否已经按照顺序排序。
 3   -d   排序时,处理英文字母、数字及空格字符外,忽略其他的字符。
 4   -f   排序时,将小写字母视为大写字母。
 5   -i   排序时,除了040至176之间的ASCII字符外,忽略其他的字符。
 6   -m   将几个排序好的文件进行合并。
 7   -M   将前面3个字母依照月份的缩写进行排序。
 8   -n   依照数值的大小排序。
 9   -o<输出文件>   将排序后的结果存入指定的文件。
10   -r   以相反的顺序来排序。
11   -t<分隔字符>   指定排序时所用的栏位分隔字符。
12   +<起始栏位>-<结束栏位>   以指定的栏位来排序,范围由起始栏位到结束栏位的前一栏位。

 

t 以":"先分割,k 按每行的第三个比较,n 是数字比较,r 倒序

 

https://blog.csdn.net/z1164072826/article/details/81056872

  

 

4. sed :面向字符流的非交互式编辑器

https://www.cnblogs.com/wangqiguo/p/6718512.html

 

5. awk:强大的文本分析工具

https://www.cnblogs.com/xiaoleiel/p/8349487.html

 

posted @ 2019-01-06 18:15  LALALA823  阅读(227)  评论(0编辑  收藏  举报