1. Sed 简介
sed 是Stream Editor(流编辑器)的缩写,是操作、过滤和转换文本内容的强大工具。常用功能有增删改查,过滤,取行。
sed 是一种新型的,非交互式的编辑器。
它能执行与编辑器vi 和 ex 相同的编辑任务。
sed 编辑器没有提供 交互式使用方式,使用者只能在命令行输入编辑命令、指定文件名,然后在屏幕上查看输出。
sed 编辑器没有破坏性,它不会修改文件,除非使用 shell 重定向 来保存输出结果。
默认情况下,所有的输出行都被打印到屏幕上。
# 查看sed软件版本 [root@oldboy ~]# sed --version GNU sed version 4.2.1
2. sed 工作过程
sed 编辑器逐行处理文件(或输入),并将输出结果发送到屏幕。
sed 的命令就是在 vi 和 ed/ex 编辑器中见到的那些。
sed 把当前正在处理的行 保存在一个临时缓存区,这个缓存区称为模式空间或临时缓冲。
sed 处理完模式空间中的行后(即在该行上执行 sed 命令后),就把该行发送到屏幕上(除非之前有命令删除这一行或取消打印操作)。
sed 处理完输入文件的最后一行后,sed 便结束运行。
sed 把每一行都存在临时缓存区,对这个副本进行编辑,所以不会修改或破坏源文件。
概括流程:
sed软件从stdin读取加载一行,判断是否符合执行操作条件:
- 若不符合,则读取下一行,将下一行文本加载到模式空间;
- 若符合条件,则执行相应的命令操作,就将该行内容发送到屏幕上。
逐行进行,直至最后一行,结束。
3. Sed 命令格式
sed命令行格式为:sed [选项] 'command' 输入文本
sed [options] [sed-commands] [input-file]
sed [选项] [sed命令] [输入文件]
说明:
1. 注意sed和后面的选项之间至少有一个空格。
2. 为了避免混淆,本文称呼sed为sed软件。sed-commands(sed命令)是sed软件内置的一些命令选项,为了和前面的options(选项)区分,故称为sed命令。
3. sed-commands既可以是单个sed命令,也可以是多个sed命令组合。
4. input-file(输入文件)是可选项,sed还能够从标准输入如管道获取输入。
sed 定位
sed 命令在没有给定的位置时,默认会处理所有行。
sed 支持以下几种地址类型:
- first~step
- first 指 起始匹配行
- sed -n 2~5p
- 从第二行开始匹配,隔5行匹配一次,即2,7,12,...
- $
- 表示匹配最后一行
- sed -n '$p' person.txt
-
/REGEXP/
- 表示匹配正则那一行,通过//之间的正则来匹配
-
\cREGEXPc
- 表示匹配正则那一行,通过\c和c之间的正则来匹配,c可以是任一字符
- addr1, addr2
- 定址 addr1,addr2 决定用于对哪些行进行编辑。地址的形式可以是数字、正则表达式或二者的结合
- 如果没有指定地址,sed 将处理输入文件中的所有行。
- 如果定址是一个数字,则这个数字代表行号,如果是逗号分隔的两个行号,那么需要处理的定址就是两行之间的范围(包括两行在内)。范围可以是数字,正则或二者组合。
- addr1,+N
- 从addr1 这行到往下 N行匹配,总共匹配N+addr1 行
- addr1,~N
- 匹配从addr1开始,到找到N的倍数行结束。
- 从第13行开始,到5的倍数行结束,这里即第15行结束:
- sed -n "13,~5p" sed_test.txt
-
# 前面的输出为行号,后面为找到的匹配的值,符合N的倍数规则
[root@oldboy /]# cat sed_test.txt -n|sed '/aa/,~2p' -n 101 aa 102 bb 108 aa 109 1 110 2 113 aa 114 5 117 aa 118 AAA
指定执行的地址范围:
- sed软件可以对单行或多行进行处理。如果在sed命令前面不指定地址范围,那么默认会匹配所有行。
- 用法:n1[,n2]{sed-commands}
- 地址用逗号分隔的,n1,n2可以用数字、正则表达式、或二者的组合表示。
-
例如:
- 10{sed-commands} 对第10行进行操作
- 10,20{sed-commands} 对第10到20行进行操作,包括第10和20行
- 10,+20{sed-commands} 对10到30(10+20)行操作,包括第10,30行
- 1~2{sed-commands} 对1,3,5,7,……行操作
- 10,${sed-commands} 对10到最后一行($代表最后一行)操作,包括第10行
- 10,~20 对10行到20的倍数行
-
正则匹配和其他方式的混合的方式:
- /oldboy/{sed-commands} 对匹配oldboy的行操作
- /oldboy/,/Alex/{sed-commands} 对匹配oldboy的行到匹配Alex的行操作
-
/oldboy/,${sed-commands} 对匹配oldboy的行到最后一行操作
-
/oldboy/,10{sed-commands} 对匹配oldboy的行到第10行操作,注意:如果前10行没有匹配到oldboy,sed软件会显示10行以后的匹配oldboy的行,如果有。
- 1,/Alex/{sed-commands} 对第1行到匹配Alex的行操作
- /oldboy/,+2{sed-commands} 对匹配oldboy的行到其后的2行操作10,${sed-commands} 对10到最后一行($代表最后一行)操作,包括第10行
sed的常用选项
- -n 使用安静模式,在一般情况下所有的STDIN都会输出到屏幕上,-n选项只打印被sed 特殊处理的行
- -e 多重编辑,且命令顺序会影响结果
- -f 指定一个sed脚本文件到命令行执行
- -r 可以使用扩展正则
- -i 直接修改文档读取的内容,不在屏幕上输出
sed 操作命令
sed 操作命令告诉sed 如何处理由地址指定的各输入行。如果没有指定地址,sed就会处理输入的所有的行。
增
- a 在当前行后 添加一行或多行 add
- sed '5a 106,dandan,CSO' person.txt
- i 在当前行之前插入文本 insert
- sed '2i 106,dandan,CSO' person.txt
删
- d 删除行 delete
改
- c 用新行替换旧行:用新文本修改(替换)当前行中的文本 change
- s 用一个字符串替换另一个
- 单独使用,将每一行中第一处匹配的字符串进行替换,sed命令
- g 每一行进行全部替换,是sed命令s的替换标志之一,非sed命令
- 替换格式:
- sed -i 's#old text#new text#g' filename_stdin
- -i 修改文件内容,sed软件的选项
- -r 可以使用扩展正则表达式
- () \1 后向引用,分组替换,与-r结合使用,可以不使用转义符号\;
- 最多可以用上9个分组
- $var 可以使用变量,双引号会解析变量
- & 代表被替换的内容
查
- p 打印行,输出指定内容,但默认会输出2次匹配的结果,因此使用-n取消默认输出
- h 把模式空间里的内容复制到暂存缓冲区
- H 把模式空间里的内容追加到暂存缓冲区
- g 取出暂存缓冲区里的内容,将其复制到模式空间,覆盖该处原有内容
- G 取出暂存缓冲区里的内容,将其复制到模式空间,追加在原有内容后面
-
l 列出非打印字符
-
n 读入下一输入行,并从下一条命令而不是第一条命令开始处理
- q 结束或退出sed
- r 从文件中读取输入行
- ! 对所选行意外的所有行应用命令
替换标志:
- g 在行内进行全局替换 global
- p 打印行
- w 将行写入文件
- x 交换暂存缓冲区与模式空间的内容
- y 将字符转换为另一字符(不能对正则表达式使用y命令)
报错信息和退出信息
遇到语法错误时, sed 会向标准错误输出发送一条相当简单的报错信息。
但是,如果 sed 判断不出错在何处,它会“断章取义”,给出令人迷惑的报错信息。
如果没有语法错误, sed 将会返回给 shell 一个退出状态,状态为 0 代表成功,为非 0 整数代表失败。
4. 实例
统一实例文本:
[root@oldboy test]# cat person.txt 101,oldboy,CEO 102,zhangyao,CTO 103,Alex,COO 104,yy,CFO 105,feixue,CTO
增删改查
增
- a 追加文本到指定行后
- i 插入文本到指定行前
这两个参数和vi编辑器的意思是一样的,i是insert插入,a是add增加
单行增加:
# 5a 在第五行之后添加文本 [root@oldboy test]# sed '5a 106,dandan,CSO' person.txt 101,oldboy,CEO 102,zhangyao,CTO 103,Alex,COO 104,yy,CFO 105,feixue,CTO 106,dandan,CSO # 2i 在第二行之前添加文本 [root@oldboy test]# sed '2i 106,dandan,CSO' person.txt 101,oldboy,CEO 106,dandan,CSO 102,zhangyao,CTO 103,Alex,COO 104,yy,CFO 105,feixue,CTO # 打印person.txt,发现add的文本未写入文件 [root@oldboy test]# cat person.txt 101,oldboy,CEO 102,zhangyao,CTO 103,Alex,COO 104,yy,CFO 105,feixue,CTO
# 第一种写法:\n换行符 [root@oldboy test]# sed '2a 106,dandan,CSO\n107,bingbing,CCO' person.txt 101,oldboy,CEO 102,zhangyao,CTO 106,dandan,CSO 107,bingbing,CCO 103,Alex,COO 104,yy,CFO 105,feixue,CTO # 第二种写法:通过"\"(回车) 多行输入 [root@oldboy test]# sed '2a 106,dandan,CSO \ > 107,bingbing.CCO' person.txt 101,oldboy,CEO 102,zhangyao,CTO 106,dandan,CSO 107,bingbing.CCO 103,Alex,COO 104,yy,CFO 105,feixue,CTO
企业案例:
在我们学习系统优化时,有一个优化点:更改ssh服务远程登录的配置。
主要的操作是在ssh的配置文件加入下面5行文本。(下面参数的具体含义见其他课程。)
Port 52113
PermitRootLogin no
PermitEmptyPasswords no
UseDNS no
GSSAPIAuthentication no
我们可以使用vi命令编辑这个文本,但这样就比较麻烦,现在想一条命令增加5行文本到第13行前?
sed '13i Port 52113\
PermitRootLogin no\
PermitEmptyPasswords no\
UseDNS no\
GSSAPIAuthentication no' /etc/ssh/sshd_config
删
- d 删除行 delete
# 删除所有行 [root@oldboy test]# sed 'd' person.txt # 删除第2行 [root@oldboy test]# sed '2d' person.txt 101,oldboy,CEO 103,Alex,COO 104,yy,CFO 105,feixue,CTO # 删除第2到第5行 [root@oldboy test]# sed '2,5d' person.txt 101,oldboy,CEO # 删除第三行到最后一行 [root@oldboy test]# sed '3,$d' person.txt 101,oldboy,CEO 102,zhangyao,CTO # 删除1,3,5行,剩余2,4行 [root@oldboy test]# sed '1~2d' person.txt 102,zhangyao,CTO 104,yy,CFO # 删除1-3行,剩余4,5行 [root@oldboy test]# sed '1,+2d' person.txt 104,yy,CFO 105,feixue,CTO # 删除匹配到zhangyao的行 [root@oldboy test]# sed '/zhangyao/d' person.txt 101,oldboy,CEO 103,Alex,COO 104,yy,CFO 105,feixue,CTO # 删除匹配到oldboy的行到匹配到Alex的行 [root@oldboy test]# sed '/oldboy/,/Alex/d' person.txt 104,yy,CFO 105,feixue,CTO # 删除从匹配到oldboy的行到第三行,剩余4,5行 [root@oldboy test]# sed '/oldboy/,3d' person.txt 104,yy,CFO 105,feixue,CTO
特殊情况:正则匹配的行不在后面的行的范围限制内,直接匹配到第五行,并删除第五行,第2行保留。
原因:正则范围内的行首,没匹配到还会继续匹配下去
[root@oldboy test]# cat person.txt 101,oldboy,CEO 102,zhangyao,CTO 103,Alex,COO 104,yy,CFO 105,feixue,CTO [root@oldboy test]# sed '/feixue/,2d' person.txt 101,oldboy,CEO 102,zhangyao,CTO 103,Alex,COO 104,yy,CFO
企业案例:打印文件内容但不包含oldboy
[root@oldboy test]# sed '/oldboy/d' person.txt 102,zhangyao,CTO 103,Alex,COO 104,yy,CFO 105,feixue,CTO
改
- c 用新文本修改(替换)当前行中的文本 change
按行替换:
# 将第二行内容修改 [root@oldboy test]# sed '2c 106,dandan,CSO' person.txt 101,oldboy,CEO 106,dandan,CSO 103,Alex,COO 104,yy,CFO 105,feixue,CTO # 不指定行号,则会修改全部行 [root@oldboy test]# sed 'c 106,dandan,CSO' person.txt 106,dandan,CSO 106,dandan,CSO 106,dandan,CSO 106,dandan,CSO 106,dandan,CSO
文本替换:
- s:单独使用→将每一行中第一处匹配的字符串进行替换 ==>sed命令
- g:每一行进行全部替换 ==>sed命令s的替换标志之一,非sed命令
- -i:修改文件内容 ==>sed软件的选项
sed软件替换模型(方框▇被替换成三角▲) sed -i 's/▇/▲/g' oldboy.log sed -i 's#▇#▲#g' oldboy.log
观察特点:
- 两边是引号,引号里面的两边分别为s和g,中间是三个一样的字符"/" 或 "#" 作为定界符。"#"能在替换内容包含"/" 有助于区别。定界符可以是任意符号如":"或"|"等,但当替换内容包含定界符时,需转义即":" "|"。经过长期实践,建议大家使用"#"作为定界符。
- 定界符"/" 或 "#",第一个和第二个之间的就是被替换的内容,第二个和第三个之间的就是替换后的内容。
- s#▇#▲#g,▇能用正则表达式,但▲不能用,必须是具体的。
- 默认sed软件是对模式空间(内存中的数据)操作,而-i选项会更改磁盘上的文件内容。
#### [root@oldboy test]# cat person.txt 101,oldboy,CEO 102,zhangyao,CTO 103,Alex,COO 104,yy,CFO 105,feixue,CTO # 将zhangyao替换为oldboyedu [root@oldboy test]# sed 's#zhangyao#oldboyedu#g' person.txt 101,oldboy,CEO 102,oldboyedu,CTO 103,Alex,COO 104,yy,CFO 105,feixue,CTO
企业案例:指定行修改配置文件,防止修改多处
[root@oldboy test]# sed '3s#0#9#g' person.txt 101,oldboy,CEO 102,zhangyao,CTO 193,Alex,COO 104,yy,CFO 105,feixue,CTO
变量替换:
# 创建一个新的测试文本 [root@oldboy test]# cat test.txt a b a # 定义变量x,y [root@oldboy test]# x=a [root@oldboy test]# y=b # 查看变量x,y [root@oldboy test]# echo $x $y a b # 将变量x替换成变量y,也就是a替换成b [root@oldboy test]# sed "s#$x#$y#g" test.txt b b b [root@oldboy test]# sed s#$x#$y#g test.txt b b b
单引号,所见即所得,不会将变量进行;
双引号,变量置换功能,解析变量后输出,不加引号相当于双引号。
[root@oldboy test]# sed 's#$x#$y#g' test.txt a b a
用eval解析:
[root@oldboy test]# eval sed 's#$x#$y#g' test.txt b b b
's#'$x'#'$y'#g'是 's#' $x '#' $y '#g' 字符串和变量的拼接:
[root@oldboy test]# sed 's#'$x'#'$y'#g' test.txt b b b
分组替换:
( )和\1的使用说明(后向引用):
sed软件的 () 的功能可以记住正则表达式的一部分,其中,\1为第一个记住的模式即第一个小括号中的匹配内容,\2第二记住的模式,即第二个小括号中的匹配内容,sed最多可以记住9个。
例:echo I am oldboy teacher.如果想保留这一行的单词oldboy,删除剩下的部分,使用圆括号标记想保留的部分。
[root@oldboy test]# echo I am oldboy teacher.|sed -r 's#^.*(oldboy).*$#\1#g' oldboy [root@oldboy test]# echo I am oldboy teacher.|sed -r 's#^.*am (.*) tea.*$#\1#g' oldboy
注意:
- 如果没有使用-r参数,就要使用转移符号\将()转义;使用-r参数,表示可以使用扩展正则表达式
- ()\1 \2 这种是 后向引用的方式。
企业案例:系统开机启动项优化
[root@oldboy test]# chkconfig --list|grep '3:on'|grep -vE "sshd|crond|network|rsyslog|sysstat"|awk '{print $1}'|sed -r 's#^(.*)#chkconfig \1 off#g'|bash
特殊符号& 代表被替换的内容:
# 将第1到第3行中的C替换为"--C--",此处:&代表C [root@oldboy test]# sed '1,3s#C#--&--#g' person.txt 101,oldboy,--C--EO 102,zhangyao,--C--TO 103,Alex,--C--OO 104,yy,CFO 105,feixue,CTO
企业案例:批量重命名文件
[root@oldboy test]# touch stu_10299_{1..5}_finished.jpg [root@oldboy test]# ls person.txt stu_10299_2_finished.jpg stu_10299_4_finished.jpg test.txt stu_10299_1_finished.jpg stu_10299_3_finished.jpg stu_10299_5_finished.jpg # 要求用sed命令重命名,效果为stu_102999_1_finished.jpg==>stu_102999_1.jpg,即删除文件名的_finished [root@oldboy test]# ls *.jpg|sed 's#(^.*)_finished(.*)$#mv & \1\2#g' -r mv stu_10299_1_finished.jpg stu_10299_1.jpg mv stu_10299_2_finished.jpg stu_10299_2.jpg mv stu_10299_3_finished.jpg stu_10299_3.jpg mv stu_10299_4_finished.jpg stu_10299_4.jpg mv stu_10299_5_finished.jpg stu_10299_5.jpg [root@oldboy test]# ls *.jpg|sed 's#(^.*)_finished(.*)$#mv & \1\2#g' -r|bash [root@oldboy test]# ls *.jpg stu_10299_1.jpg stu_10299_2.jpg stu_10299_3.jpg stu_10299_4.jpg stu_10299_5.jpg
查
- p 打印行,输出指定内容,但默认会输出2次匹配的结果,因此使用-n取消默认输出
按行查询:
# p参数会默认输出两次,要使用-n参数取消默认输出 [root@oldboy test]# sed '2p' person.txt 101,oldboy,CEO 102,zhangyao,CTO 102,zhangyao,CTO 103,Alex,COO 104,yy,CFO 105,feixue,CTO [root@oldboy test]# sed '2p' person.txt -n 102,zhangyao,CTO # 输出第2到第3行 [root@oldboy test]# sed '2,3p' person.txt -n 102,zhangyao,CTO 103,Alex,COO # 输出1,3,5行 [root@oldboy test]# sed '1~2p' person.txt -n 101,oldboy,CEO 103,Alex,COO 105,feixue,CTO # 输出所有行 [root@oldboy test]# sed 'p' person.txt -n 101,oldboy,CEO 102,zhangyao,CTO 103,Alex,COO 104,yy,CFO 105,feixue,CTO
按字符串查询:
[root@oldboy test]# sed -n '/CTO/p' person.txt 102,zhangyao,CTO 105,feixue,CTO [root@oldboy test]# sed -n '/CTO/,/CFO/p' person.txt 102,zhangyao,CTO 103,Alex,COO 104,yy,CFO 105,feixue,CTO
混合查询:
[root@oldboy test]# sed -n '/CTO/p' person.txt 102,zhangyao,CTO 105,feixue,CTO [root@oldboy test]# sed -n '/CTO/,/CFO/p' person.txt 102,zhangyao,CTO 103,Alex,COO 104,yy,CFO 105,feixue,CTO