3.3.2 使用 cut 选定字段

    cut 命令是用来剪下文本文件里的数据,文本文件可以是字段类型或是字符类型。后一种数据类型在遇到需要从文件里剪下特定的列时,特别方便。请注意:一个制表字符在此被视为单个字符。
    
    举例来说,下面的命令可显示系统上每个用户的登录名及其全名:
    [root@avention etc]# cut -d : -f 1,5  /etc/passwd
    root:root
    bin:bin
    daemon:daemon
 
    通过字符列表做剪下操作时是很方便的。例如,你只要取出命令 ls -l的输出结果中的文件权限字段:
    [root@avention etc]# ls -l | cut -c 2-10 | grep -v otal
    rwxr-xr-x
    rw-r--r--
    rwxr-xr-x
    rw-r--r--
    rw-r--r--
 
 
    不过这种用法比使用字段的风险要大。因为你无法保证行内的每个字段长度总是一样的。一般来说,我们偏好以字段为基础来提取数据。
 
                                                      cut
语法
    cut -c list [ file ... ]
    cut -f list [ -d delim ] [ file ... ]
 
用途
    从输入文件中选择一或多个字段或者一组字符,配合管道(pipline),可再做进一步处理。
 
主要选项
    -c  list
        以字符为主,执行剪下的操作。list 为字符编号或一段范围列表(以逗点隔开),例如 1,3,5-12,42 
 
    -d  delim 
        通过-f 选项,使用 delim 作为定界符,默认的定界符为制表符(Tab)。
 
    -f  list
        以字段为主,作剪下的操作。list 为字段编号或一段范围的列表(以逗点隔开)。
 
行为模式
    剪下输入字符串中指定的字段或指定的范围。若处理的是字段,则定界符隔开的即为各字段,而输出时字段也给定的定界符隔开。若命令行没有指定文件,则读取标准输入。
 
 

 

cut

文件内容查看

显示行中的指定部分,删除文件中指定字段

显示文件的内容,类似于下的type命令。

说明

  • 该命令有两项功能,其一是用来显示文件的内容,它依次读取由参数file所指明的文件,将它们的内容输出到标准输出上;其二是连接两个或多个文件,如cut fl f2 > f3将把文件fl和几的内容合并起来,然后通过输出重定向符“>”的作用,将它们放入文件f3中。
  • 当文件较大时,文本在屏幕上迅速闪过(滚屏),用户往往看不清所显示的内容。因此,一般用more等命令分屏显示。
    为了控制滚屏,可以按Ctrl+S键,停止滚屏;按Ctrl+Q键可以恢复滚屏。
    按Ctrl+C(中断键可以终止该命令的执行,并且返回Shell提示符状态。

选项

-b:仅显示行中指定直接范围的内容;
 
-c:仅显示行中指定范围的字符;
 
-d:指定字段的分隔符,默认的字段分隔符为“TAB”;
 
-f:显示指定字段的内容;
 
-n:与“-b”选项连用,不分割多字节字符;
 
--complement:补足被选择的字节、字符或字段;
 
--out-delimiter=<字段分隔符>:指定输出内容是的字段分割符;
 
--help:显示指令的帮助信息;
 
--version:显示指令的版本信息。
 
[2018-07-03 16:06:36][17353][QRYACCTITEM][INFO]QRYACCTITEM
 cut -d '[' -f 4  qryother.20180703.log | sort -u | sed 's;\];;'
参数
文件:指定要进行内容过滤的文件。

实例

1.例如有一个学生报表信息,包含No、Name、Mark、Percent:
cat test.txt
 
No Name Mark Percent
01 tom 69 9102 jack 71 8703 alex 68 98
 
使用 -f 选项提取指定字段:
cut -f 1 test.txt
结果:
No
010203
cut -f2,3 test.txt
结果:
Name Mark
tom 69
jack 71
alex 68
 
--complement 选项提取指定字段之外的列(打印除了第二列之外的列):
cut -f2 --complement test.txt
结果:
No Mark Percent
01 69 9102 71 8703 68 98
 
2.使用 -d 选项指定字段分隔符:
cat test2.txt
 
No;Name;Mark;Percent
01;tom;69;9102;jack;71;8703;alex;68;98
 
cut -f2 -d";" test2.txt
结果:
Name
tom
jack
alex
 
3.指定字段的字符或者字节范围
cut命令可以将一串字符作为列来显示,字符字段的记法:
 
N-:从第N个字节、字符、字段到结尾;
 
N-M:从第N个字节、字符、字段到第M个(包括M在内)字节、字符、字段;
 
-M:从第1个字节、字符、字段到第M个(包括M在内)字节、字符、字段。
 
上面是记法,结合下面选项将摸个范围的字节、字符指定为字段:
 
-b 表示字节;
 
-c 表示字符;
 
-f 表示定义字段。
 
 例:
cat test.txt
 
abcdefghijklmnopqrstuvwxyz
abcdefghijklmnopqrstuvwxyz
abcdefghijklmnopqrstuvwxyz
abcdefghijklmnopqrstuvwxyz
abcdefghijklmnopqrstuvwxyz
 
打印第1个到第3个字符:
 
cut -c1-3 test.txt
结果:
abc
abc
abc
abc
abc
 
打印前2个字符:
cut -c-2 test.txt
结果:
ab
ab
ab
ab
ab
 
打印从第5个字符开始到结尾:
cut -c5- test.txt
结果:
efghijklmnopqrstuvwxyz
efghijklmnopqrstuvwxyz
efghijklmnopqrstuvwxyz
efghijklmnopqrstuvwxyz
efghijklmnopqrstuvwxyz
 

 
1、命令作用
    以某种方式按照文件的行进行分割
 
2、参数列表
    (1)-b  按字节选取,忽略多字节字符边界,除非也指定了-n标志
    (2)-c  按字符选取
    (3)-d  自定义分隔符,默认为制表符
    (4)-f   与-d一起使用,指定显示哪个区域
    (5)-s  不打印没有包含分界符的行
 
3、控制范围
    (1)n  只有第n项
    (2)n- 从第n项一直到行尾
    (3)n-m 从第n项到第m项(包含m)
    (4)-m   从一行的开始到第m项(包含m)
    (5)-      从一行的开始到结束的所有项
 
4、实例
    (1)cat /etc/passwd | cut -b1-3          #取每行的第1-3字字节
    (2)cat /etc/passwd | cut -b1-3,5-7,8  #取每行的第1-3,5-7,8的字节(后面的数字会先进行从小到大的排序)需要事先知道具体字节,很容易出错
    (3)cat song.txt | cut -nb 1,2,3  #当-b添加-n后则不会分隔多字节(我的系统是utf-8,所以需要3个字节表示一个汉字)
    (4)cat /etc/passwd | cut -c1,3      #使用于中文
    (5)cat /etc/passwd | cut -d : -f 3  #以:分隔,取第三段    #这个常用
    (6)cat /etc/passwd | cut -d ''        #以空格进行分割,且是一个空格
 
    缺点:有时候分隔符很难确定
 
echo $m|cut -d',' -f1-4  cut如果不指定文件名就用保准输入进行切割
posted @ 2019-01-23 10:02  Avention  阅读(297)  评论(0编辑  收藏  举报