3.3.2 使用 cut 选定字段
cut 命令是用来剪下文本文件里的数据,文本文件可以是字段类型或是字符类型。后一种数据类型在遇到需要从文件里剪下特定的列时,特别方便。请注意:一个制表字符在此被视为单个字符。
举例来说,下面的命令可显示系统上每个用户的登录名及其全名:
[root@avention etc]# cut -d : -f 1,5 /etc/passwd
root:root
bin:bin
daemon:daemon
通过字符列表做剪下操作时是很方便的。例如,你只要取出命令 ls -l的输出结果中的文件权限字段:
[root@avention etc]# ls -l | cut -c 2-10 | grep -v otal
rwxr-xr-x
rw-r--r--
rwxr-xr-x
rw-r--r--
rw-r--r--
不过这种用法比使用字段的风险要大。因为你无法保证行内的每个字段长度总是一样的。一般来说,我们偏好以字段为基础来提取数据。
cut
语法
cut -c list [ file ... ]
cut -f list [ -d delim ] [ file ... ]
用途
从输入文件中选择一或多个字段或者一组字符,配合管道(pipline),可再做进一步处理。
主要选项
-c list
以字符为主,执行剪下的操作。list 为字符编号或一段范围列表(以逗点隔开),例如 1,3,5-12,42
-d delim
通过-f 选项,使用 delim 作为定界符,默认的定界符为制表符(Tab)。
-f list
以字段为主,作剪下的操作。list 为字段编号或一段范围的列表(以逗点隔开)。
行为模式
剪下输入字符串中指定的字段或指定的范围。若处理的是字段,则定界符隔开的即为各字段,而输出时字段也给定的定界符隔开。若命令行没有指定文件,则读取标准输入。
cut
文件内容查看
显示行中的指定部分,删除文件中指定字段
显示文件的内容,类似于下的type命令。
说明
- 该命令有两项功能,其一是用来显示文件的内容,它依次读取由参数file所指明的文件,将它们的内容输出到标准输出上;其二是连接两个或多个文件,如cut fl f2 > f3将把文件fl和几的内容合并起来,然后通过输出重定向符“>”的作用,将它们放入文件f3中。
- 当文件较大时,文本在屏幕上迅速闪过(滚屏),用户往往看不清所显示的内容。因此,一般用more等命令分屏显示。
为了控制滚屏,可以按Ctrl+S键,停止滚屏;按Ctrl+Q键可以恢复滚屏。
按Ctrl+C(中断键可以终止该命令的执行,并且返回Shell提示符状态。
选项
-b:仅显示行中指定直接范围的内容;
-c:仅显示行中指定范围的字符;
-d:指定字段的分隔符,默认的字段分隔符为“TAB”;
-f:显示指定字段的内容;
-n:与“-b”选项连用,不分割多字节字符;
--complement:补足被选择的字节、字符或字段;
--out-delimiter=<字段分隔符>:指定输出内容是的字段分割符;
--help:显示指令的帮助信息;
--version:显示指令的版本信息。
[2018-07-03 16:06:36][17353][QRYACCTITEM][INFO]QRYACCTITEM
cut -d '[' -f 4 qryother.20180703.log | sort -u | sed 's;\];;'
参数
文件:指定要进行内容过滤的文件。
实例
1.例如有一个学生报表信息,包含No、Name、Mark、Percent:
cat test.txt
No Name Mark Percent
01 tom 69 9102 jack 71 8703 alex 68 98
使用 -f 选项提取指定字段:
cut -f 1 test.txt
结果:
No
010203
cut -f2,3 test.txt
结果:
Name Mark
tom 69
jack 71
alex 68
--complement 选项提取指定字段之外的列(打印除了第二列之外的列):
cut -f2 --complement test.txt
结果:
No Mark Percent
01 69 9102 71 8703 68 98
2.使用 -d 选项指定字段分隔符:
cat test2.txt
No;Name;Mark;Percent
01;tom;69;9102;jack;71;8703;alex;68;98
cut -f2 -d";" test2.txt
结果:
Name
tom
jack
alex
3.指定字段的字符或者字节范围
cut命令可以将一串字符作为列来显示,字符字段的记法:
N-:从第N个字节、字符、字段到结尾;
N-M:从第N个字节、字符、字段到第M个(包括M在内)字节、字符、字段;
-M:从第1个字节、字符、字段到第M个(包括M在内)字节、字符、字段。
上面是记法,结合下面选项将摸个范围的字节、字符指定为字段:
-b 表示字节;
-c 表示字符;
-f 表示定义字段。
例:
cat test.txt
abcdefghijklmnopqrstuvwxyz
abcdefghijklmnopqrstuvwxyz
abcdefghijklmnopqrstuvwxyz
abcdefghijklmnopqrstuvwxyz
abcdefghijklmnopqrstuvwxyz
打印第1个到第3个字符:
cut -c1-3 test.txt
结果:
abc
abc
abc
abc
abc
打印前2个字符:
cut -c-2 test.txt
结果:
ab
ab
ab
ab
ab
打印从第5个字符开始到结尾:
cut -c5- test.txt
结果:
efghijklmnopqrstuvwxyz
efghijklmnopqrstuvwxyz
efghijklmnopqrstuvwxyz
efghijklmnopqrstuvwxyz
efghijklmnopqrstuvwxyz
1、命令作用
以某种方式按照文件的行进行分割
2、参数列表
(1)-b 按字节选取,忽略多字节字符边界,除非也指定了-n标志
(2)-c 按字符选取
(3)-d 自定义分隔符,默认为制表符
(4)-f 与-d一起使用,指定显示哪个区域
(5)-s 不打印没有包含分界符的行
3、控制范围
(1)n 只有第n项
(2)n- 从第n项一直到行尾
(3)n-m 从第n项到第m项(包含m)
(4)-m 从一行的开始到第m项(包含m)
(5)- 从一行的开始到结束的所有项
4、实例
(1)cat /etc/passwd | cut -b1-3 #取每行的第1-3字字节
(2)cat /etc/passwd | cut -b1-3,5-7,8 #取每行的第1-3,5-7,8的字节(后面的数字会先进行从小到大的排序)需要事先知道具体字节,很容易出错
(3)cat song.txt | cut -nb 1,2,3 #当-b添加-n后则不会分隔多字节(我的系统是utf-8,所以需要3个字节表示一个汉字)
(4)cat /etc/passwd | cut -c1,3 #使用于中文
(5)cat /etc/passwd | cut -d : -f 3 #以:分隔,取第三段 #这个常用
(6)cat /etc/passwd | cut -d '' #以空格进行分割,且是一个空格
缺点:有时候分隔符很难确定
echo $m|cut -d',' -f1-4 cut如果不指定文件名就用保准输入进行切割