三剑客之SED行天下
功能说明
Sed是Strem Editor(流编辑器)缩写,是操作、过滤和转换文本内容的强大工具。常用功能有增删改查,过滤,取行。
[root@oldboy ~]# sed --version #→ sed软件版本 GNU sed version 4.2.1
语法格式
sed [options] [sed-commands] [input-file] sed [选项] [sed命令] [输入文件] 说明: 1. 注意sed和后面的选项之间至少有一个空格。 2. 为了避免混淆,本文称呼sed为sed软件。sed-commands(sed命令)是sed软件内置的一些命令选项,为了和前面的options(选项)区分,故称为sed命令。 3. sed-commands既可以是单个sed命令,也可以是多个sed命令组合。 4. input-file(输入文件)是可选项,sed还能够从标准输入如管道获取输入。
命令执行流程
概括流程:Sed软件从文件或管道中读取一行,处理一行,输出一行;再读取一行,再处理一行,再输出一行……
模式空间:sed软件内部的一个临时缓存,用于存放读取到的内容。
使用范例
1. 统一实验文本
# 创建包含下面内容的文件,后面的操作都会使用这个文件。 [root@oldboy ~]# cat person.txt 101,oldboy,CEO 102,zhangyao,CTO 103,Alex,COO 104,yy,CFO 105,feixue,CIO
2. 增删改查
a 追加文本到指定行后 i 插入文本到指定行前
2.1 增
2.1.1 单行增加
[root@oldboy ~]# sed '2a 106,dandan,CSO' person.txt 101,oldboy,CEO 102,zhangyao,CTO 106,dandan,CSO 103,Alex,COO 104,yy,CFO 105,feixue,CIO [root@oldboy ~]# sed '2i 106,dandan,CSO' person.txt 101,oldboy,CEO 106,dandan,CSO 102,zhangyao,CTO 103,Alex,COO 104,yy,CFO 105,feixue,CIO
2.1.2 多行增加
[root@oldboy ~]# sed '2a 106,dandan,CSO\n107,bingbing,CCO' person.txt 101,oldboy,CEO 102,zhangyao,CTO 106,dandan,CSO #→第1种写法 107,bingbing,CCO 103,Alex,COO 104,yy,CFO 105,feixue,CIO [root@oldboy ~]# sed '2a 106,dandan,CSO \ > 107,bingbing,CCO' person.txt 101,oldboy,CEO 102,zhangyao,CTO 106,dandan,CSO #→第2种写法 107,bingbing,CCO 103,Alex,COO 104,yy,CFO 105,feixue,CIO #→sed命令i的使用方法是一样的,因此不再列出。
企业案例1:优化SSH配置(一键完成增加若干参数)
在我们学习系统优化时,有一个优化点:更改ssh服务远程登录的配置。主要的操作是在ssh的配置文件加入下面5行文本。(下面参数的具体含义见其他课程。)
Port 52113 PermitRootLogin no PermitEmptyPasswords no UseDNS no GSSAPIAuthentication no
我们可以使用vi命令编辑这个文本,但这样就比较麻烦,现在想一条命令增加5行文本到第13行前?
指定执行的地址范围
sed软件可以对单行或多行进行处理。如果在sed命令前面不指定地址范围,那么默认会匹配所有行。 用法:n1[,n2]{sed-commands} 地址用逗号分隔的,n1,n2可以用数字、正则表达式、或二者的组合表示。 例子: 10{sed-commands} 对第10行操作 10,20{sed-commands} 对10到20行操作,包括第10,20行 10,+20{sed-commands} 对10到30(10+20)行操作,包括第10,30行 1~2{sed-commands} 对1,3,5,7,……行操作 10,${sed-commands} 对10到最后一行($代表最后一行)操作,包括第10行 /oldboy/{sed-commands} 对匹配oldboy的行操作 /oldboy/,/Alex/{sed-commands} 对匹配oldboy的行到匹配Alex的行操作 /oldboy/,${sed-commands} 对匹配oldboy的行到最后一行操作 /oldboy/,10{sed-commands} 对匹配oldboy的行到第10行操作,注意:如果前10行没有匹配到oldboy,sed软件会显示10行以后的匹配oldboy的行,如果有。 1,/Alex/{sed-commands} 对第1行到匹配Alex的行操作 /oldboy/,+2{sed-commands} 对匹配oldboy的行到其后的2行操作
2.2 删
d 删除指定的行 [root@oldboy ~]# sed 'd' person.txt [root@oldboy ~]# [root@oldboy ~]# sed '2d' person.txt 101,oldboy,CEO 103,Alex,COO 104,yy,CFO 105,feixue,CIO [root@oldboy ~]# sed '2,5d' person.txt 101,oldboy,CEO [root@oldboy ~]# sed '3,$d' person.txt 101,oldboy,CEO 102,zhangyao,CTO [root@oldboy ~]# sed '1~2d' person.txt 102,zhangyao,CTO 104,yy,CFO [root@oldboy ~]# sed '1,+2d' person.txt 104,yy,CFO 105,feixue,CIO [root@oldboy ~]# sed '/zhangyao/d' person.txt 101,oldboy,CEO 103,Alex,COO 104,yy,CFO 105,feixue,CIO [root@oldboy ~]# sed '/oldboy/,/Alex/d' person.txt 104,yy,CFO 105,feixue,CIO [root@oldboy ~]# sed '/oldboy/,3d' person.txt 104,yy,CFO 105,feixue,CIO
企业案例2:打印文件内容但不包含oldboy
[root@oldboy ~]# sed '/oldboy/d' person.txt #→删除包含"oldboy"的行 102,zhangyao,CTO 103,Alex,COO 104,yy,CFO 105,feixue,CIO
2.3 改
2.3.1 按行替换
c 用新行取代旧行
[root@oldboy ~]# sed '2c 106,dandan,CSO' person.txt 101,oldboy,CEO 106,dandan,CSO 103,Alex,COO 104,yy,CFO 105,feixue,CIO
2.3.2 文本替换
s:单独使用→将每一行中第一处匹配的字符串进行替换 ==>sed命令
g:每一行进行全部替换 ==>sed命令s的替换标志之一,非sed命令
-i:修改文件内容 ==>sed软件的选项
sed软件替换模型(方框▇被替换成三角▲)
sed -i 's/▇/▲/g' oldboy.log sed -i 's#▇#▲#g' oldboy.log
观察特点
- 两边是引号,引号里面的两边分别为
s
和g
,中间是三个一样的字符/
或#
作为定界符。#
能在替换内容包含/
有助于区别。定界符可以是任意符号如:
或|
等,但当替换内容包含定界符时,需转义即:
|
。经过长期实践,建议大家使用#
作为定界符。 - 定界符
/
或#
,第一个和第二个之间的就是被替换的内容,第二个和第三个之间的就是替换后的内容。 s#▇#▲#g
,▇能用正则表达式,但▲不能用,必须是具体的。- 默认sed软件是对模式空间(内存中的数据)操作,而-i选项会更改磁盘上的文件内容。
[root@oldboy ~]# sed 's#zhangyao#oldboyedu#g' person.txt 101,oldboy,CEO 102,oldboyedu,CTO 103,Alex,COO 104,yy,CFO 105,feixue,CIO [root@oldboy ~]# cat person.txt 101,oldboy,CEO 102,zhangyao,CTO 103,Alex,COO 104,yy,CFO 105,feixue,CIO [root@oldboy ~]# sed -i 's#zhangyao#BBB#g' person.txt [root@oldboy ~]# cat person.txt 101,oldboy,CEO 102,BBB,CTO 103,Alex,COO 104,yy,CFO 105,feixue,CIO [root@oldboy ~]# sed -i 's#oldboyedu#zhangyao#g' person.txt #→还原测试文件
企业案例3:指定行修改配置文件
指定行精确修改配置文件,这样可以防止修改多了地方。
[root@oldboy ~]# sed '3s#0#9#' person.txt 101,oldboy,CEO 102,zhangyao,CTO 193,Alex,COO 104,yy,CFO 105,feixue,CIO
2.3.3 变量替换
[root@oldboy ~]# cat test.txt #→再新建一个文本 a b a [root@oldboy ~]# x=a [root@oldboy ~]# y=b [root@oldboy ~]# echo $x $y a b [root@oldboy ~]# sed s#$x#$y#g test.txt b b b [root@oldboy ~]# sed 's#$x#$y#g' test.txt a b a [root@oldboy ~]# sed 's#'$x'#'$y'#g' test.txt b b b [root@oldboy ~]# sed "s#$x#$y#g" test.txt b b b [root@oldboy ~]# eval sed 's#$x#$y#g' test.txt b b b
2.3.4 分组替换\( \)
和\1
的使用说明
sed软件的\( \)
的功能可以记住正则表达式的一部分,其中,\1
为第一个记住的模式即第一个小括号中的匹配内容,\2
第二记住的模式,即第二个小括号中的匹配内容,sed最多可以记住9个。
例:echo I am oldboy teacher.
如果想保留这一行的单词oldboy,删除剩下的部分,使用圆括号标记想保留的部分。
[root@oldboy ~]# echo I am oldboy teacher. |sed 's#^.*am \([a-z].*\) tea.*$#\1#g' oldboy [root@oldboy ~]# echo I am oldboy teacher. |sed -r 's#^.*am ([a-z].*) tea.*$#\1#g' oldboy [root@oldboy ~]# echo I am oldboy teacher. |sed -r 's#I (.*) (.*) teacher.#\1\2#g' amoldboy
命令说明
思路:用oldboy
字符替换I am oldboy teacher.
下面解释用□
代替空格
^.*am□
–>这句的意思是以任意字符开头到am□
为止,匹配文件中的I am□
字符串;\([a-z].*\)□
–>这句的外壳就是括号\(\)
,里面的[a-z]
表示匹配26个字母的任何一个,[a-z].*
合起来就是匹配任意多个字符,本题来说就是匹配oldboy
字符串,由于oldboy
字符串是需要保留的,因此用括号括起来匹配,后面通过\1
来取oldboy
字符串。□tea.*$
–>表示以空格tea
起始,任意字符结尾,实际就是匹配oldboy
字符串后,紧接着的字符串□teacher.
;- 后面被替换的内容中的
\1
就是取前面的括号里的内容了,也就是我们要的oldboy
字符串。 ()
是扩展正则表达式的元字符,sed软件默认识别基本正则表达式,想要使用扩展正则需要使用\
转义,即\(\)
。sed使用-r
选项则可以识别扩展正则表达式,此时使用\(\)
反而会出错。
企业案例4:系统开机启动项优化
[root@oldboy ~]# chkconfig --list|grep "3:on"|grep -vE "sshd|crond|network|rsyslog|sysstat"|awk '{print $1}'|sed -r 's#^(.*)#chkconfig \1 off#g'|bash [root@oldboy ~]# chkconfig --list|grep "3:on" crond 0:off 1:off 2:on 3:on 4:on 5:on 6:off network 0:off 1:off 2:on 3:on 4:on 5:on 6:off rsyslog 0:off 1:off 2:on 3:on 4:on 5:on 6:off sshd 0:off 1:off 2:on 3:on 4:on 5:on 6:off sysstat 0:off 1:on 2:on 3:on 4:on 5:on 6:off
2.3.5 特殊符号&
代表被替换的内容
[root@oldboy ~]# sed '1,3s#C#--&--#g' person.txt #→此处&等于C 101,oldboy,--C--EO #→将1到3行的C替换为--C-- 102,zhangyao,--C--TO 103,yy,--C--OO 104,feixue,CFO 105,dandan,CIO
企业案例5:批量重命名文件
当前目录下有文件如下所示:
[root@oldboy test]# ls stu_102999_1_finished.jpg stu_102999_2_finished.jpg stu_102999_3_finished.jpg stu_102999_4_finished.jpg stu_102999_5_finished.jpg
要求用sed命令重命名,效果为stu_102999_1_finished.jpg==>stu_102999_1.jpg
,即删除文件名的_finished
2.4 查
p 输出指定内容,但默认会输出2次匹配的结果,因此使用n取消默认输出
2.4.1 按行查询
[root@oldboy ~]# sed '2p' person.txt 101,oldboy,CEO 102,zhangyao,CTO 102,zhangyao,CTO 103,Alex,COO 104,yy,CFO 105,feixue,CIO [root@oldboy ~]# sed -n '2p' person.txt 102,zhangyao,CTO [root@oldboy ~]# sed -n '2,3p' person.txt 102,zhangyao,CTO 103,Alex,COO 说明:取行就用sed,最简单 [root@oldboy ~]# sed -n '1~2p' person.txt 101,oldboy,CEO 103,Alex,COO 105,feixue,CIO [root@oldboy ~]# sed -n 'p' person.txt 101,oldboy,CEO 102,zhangyao,CTO 103,yy,COO 104,feixue,CFO 105,dandan,CIO
2.4.2 按字符串查询
[root@oldboy ~]# sed -n '/CTO/p' person.txt 102,zhangyao,CTO [root@oldboy ~]# sed -n '/CTO/,/CFO/p' person.txt 102,zhangyao,CTO 103,Alex,COO 104,yy,CFO
2.4.3 混合查询
[root@oldboy ~]# sed -n '2,/CFO/p' person.txt 102,zhangyao,CTO 103,Alex,COO 104,yy,CFO [root@oldboy ~]# sed -n '/feixue/,2p' person.txt 105,feixue,CIO #→特殊情况,前两行没有匹配到feixue,就向后匹配,如果匹配到feixue就打印此行。
博文首发张耀的博客:http://www.zyops.com/commands-sed