sed命令详解-应用篇
本篇从实用的角度讲解sed,关于sed的详细帮助文档,请参考前篇
http://www.cnblogs.com/the-capricornus/p/5279979.html
本篇用到的选项请参考前篇。
本篇用到的地址相关的内容请参考前篇。
本篇大概分3部分:基本应用、模式空间、标签。
sed可以直接处理文本文件,也可以处理管道中的文本。
sed通常情况下每次处理一行文本,这行文本保存在sed的模式空间内。
那有哪些不通常的情况呢?比如你使用N命令往模式空间追加了一行内容。
现在说说sed都可以进行哪些操作。
我们先从基本的操作入手:
= 打印行号 a\ 追加新行 i\ 插入新行 p 打印 q 退出 Q 立即退出 r 追加从文件读取的文本 c\ 行替换 s 替换 P 打印模式空间的第一行 R 追加从文件读取的一行
再来说说高级操作,高级操作都是围绕模式空间展开的:
d 删除模式空间 h 复制模式空间到保持空间 g 复制保持空间到模式空间 n 读取下一行到模式空间 w 写模式空间到文件 x 交换模式空间和保持空间 y 将模式空间内source里的字符转换成dest里对应的字符 G 追加保持空间到模式空间 H 追加模式空间到保持空间 N 追加下一行到模式空间 D 删除模式空间中的一行 W 写模式空间的第一行到文件
再来围绕标签来谈谈高级操作:
: 为b和t命令定义标签 b 切换到标签 t 如果前面的替换成功切换到标签 T 如果前边的替换失败切换到标签
基本应用
sed默认打印模式空间的内容到输出上。如果你执行了如下的命令:
echo -e "abc\ndef" | sed 'p'
每行都打印2遍,一遍是默认的对模式空间的打印,一遍是p命令的打印。
如果你加上选项-n,每行只打印一遍。默认的对模式空间的打印被关闭。
echo -e "abc\ndef" | sed -n 'p'
如果你执行的了删除模式空间的操作,则被删除的模式空间将不被打印。
echo -e "abc\ndef" | sed '1d'
下面的命令会在每一行的前边加上一行,内容是行号。
echo -e "abc\ndef" | sed '='
那你想知道总共有多少行,你可以使用如下的命令,这个可以用来统计文本行数。
echo -e "abc\ndef" | sed -n '$='
追加行不多说,但是被追加的行即使你使用了抑制模式,还是会被打印出来的。
echo -e "abc\ndef" | sed -n 'a\s'
要注意的一点是,你启用-i选项编辑文件时,你同时用了-n选项的话,要知道后果有多严重。
就是文件的所有内容将被输出替换掉。比如你执行了如下的操作:
sed -ni '1a\Note:all content is deleted.' aaa
则文件aaa的内容将只有一行啦,所有的数据都丢失啦,太可怕啦,文件操作一定要谨慎。
为了安全起见,在文件操作之前,先生成一个文件的备份。
sed -n -i_bak '1a\Note:all content is deleted.' aaa
将先生成aaa的备份文件aaa_bak,然后进行文件操作。
-i选项就是这样的,你指定了备份就生成,你不指定就不生成。
你可以利用sed命令来合并2个文档,下面的命令把file1的内容追加到file2的结尾。
sed -i '$rfile1' file2
如果你使用了大写的R,则文件变成file2一行,file1一行这样的交替这来。
sed -i '$Rfile1' file2
下面的栗子将把第一行替换成str:
echo -e "abc\ndef" | sed '1c\str'
你想在处理完某行就退出吗?下面的栗子处理完第一行就退出:
echo -e "abc\ndef" | sed '1q'
下面的栗子你看和上面的栗子有什么不同?
echo -e "abc\ndef" | sed '1Q'
连模式空间都不打印了,立即退出
上面说了那么多栗子,用的都是行取地址,其实也可以使用正则表达式取地址。
用2个斜杠就表示里边的内容是正则表达式。
echo -e "abc\ndef" | sed '/abc/c\str'
那你想把abc替换成def的话,如下使用
echo -e "abc" | sed 's/abc/def/'
上面的命令只替换模式空间中第一次出现的,如果你想替换所有的,加上标志g
echo -e "abc\nabc" | sed 's/abc/def/g'
还有很多标志请参考前篇文档。
下面从模式空间的角度来谈谈高级应用。
下面的栗子将创建文件aaa并往里边写入2行。
echo -e 'abc\ndef' | sed 'waaa'
下面的栗子p命令打印的是偶数行
echo -e 'abc\ndef\nghi\njkl' | sed -n 'n;p'
对于上面的命令,用分号隔开2个操作,对每一行都会执行所有的操作。
操作第一行时,n读取第二行到模式空间,接着打印,打印的内容是第二行。
然后操作第三行,n读取第四行到模式空间,接着打印,打印的内容是第四行。
但是如果你使用N操作,将是追加下一行到模式空间,p打印2行内容
echo -e 'abc\ndef\nghi\njkl' | sed -n 'N;p'
下边是一个对应字符替换的栗子,将输出 1xx2xx3xx
echo "axxbxxcxx" | sed 'y/abc/123/'
下边的命令将只打印奇数行
echo -e 'abc\ndef\nghi\njkl' | sed -n 'h;n;g;p'
下边的命令也是只打印了奇数行
echo -e 'abc\ndef\nghi\njkl' | sed -n 'h;n;x;p'
下边的命令把偶数行和奇数行的顺序互换
echo -e 'abc\ndef\nghi\njkl' | sed -n 'h;n;G;p'
下面从标签的角度来谈谈高级应用
用:定义一个标签,用b切换到标签
echo -e "abc\ndef\nghi\njkl" | sed -n '/[a,j]/b label;y/abcdefghijkl/0123456789AB/;:label;p'
b是无条件跳转,而t是有条件跳转的,那就是它前边的s///命令执行成功的话,它就跳转
echo -e "abcdefg\nhi\njkl" | sed ':label;s/^.\{1,19\}$/ &/;tlabel'
上面的命令正则表达式是^.{1,19}$,就是1到19个任意字符,&是一个引用,内容就是正则表达式匹配到的。
不到19个字符总会匹配成功,匹配成功就替换成空格加引用。最后所有的行都变成20个字符宽度的右对齐。