Linux操作系统之sed命令详解

前言

1、Linux操作系统下的  sed  命令是利用脚本来处理文本文件。

2、sed 命令可依照脚本的指令来处理、编辑文本文件。

3、sed 命令主要用来自动编辑一个或多个文件、简化对文件的反复操作、编写转换程序等。

4、sed 是一种流编辑器,它是文本处理中非常好的工具,能够完美的配合正则表达式使用,功能不同凡响。处理时,把当前处理的行存储在临时缓冲区中,称为“模式空间”(pattern space),接着用 sed 命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。接着处理下一行,这样不断重复,直到文件末尾。文件内容并没有改变,除非你使用重定向存储输出。

5、 sed 命令主要用来自动编辑一个或多个文件,可以将数据行进行替换、删除、新增、选取等特定工作,简化对文件的反复操作,编写转换程序等。

命令语法

sed [-hnV][-e<script>][-f<script文件>][文本文件]

更直观的看:

sed的命令格式:sed [options] 'command' file(s)

sed的脚本格式:sed [options] -f scriptfile file(s)

参数说明:

1、 -e<script> 或 --expression=<script> :以选项中指定的script脚本行来处理输入的文本文件。

2、 -f<script文件> 或 --file=<script文件> :以选项中指定的script脚本文件来处理输入的文本文件。

3、 -h 或  --help :显示帮助。

4、 -n 或 --quiet 或 --silent :仅显示script脚本处理后的结果。

5、 -V 或--version:显示命令版本信息。

 -e :直接在命令行模式上进行sed动作编辑,此为默认选项;

 -f :将sed的动作写在一个文件内,用–f filename 执行filename内的sed动作;

 -i :直接修改文件内容;

 -n :只打印模式匹配的行;

 -r :支持扩展表达式;

 -h或--help:显示帮助;

 -V或--version:显示版本信息。

动作说明:

a :新增, a 的后面可以接字符串,而这些字串会在新的一行出现(目前行的下一行)。

c :取代, c 的后面可以接字符串,这些字串可以取代 n1,n2 之间的行。

d :删除,所以 d 后面通常不接任何东西;

i :插入, i 的后面可以接字符串,而这些字串会在新的一行出现(目前的上一行)。

p :打印,亦即将某个选择的数据印出。通常 p 会与参数 sed -n 命令一起运行。

s :取代,可以直接进行取代的工作,通常 s 的动作可以搭配正则表达式。

sed常用命令

 a\ 在当前行下面插入文本;

 i\ 在当前行上面插入文本;

 c\ 把选定的行改为新的文本;

 d 删除,删除选择的行;

 D 删除模板块的第一行;

 s 替换指定字符;

 h 拷贝模板块的内容到内存中的缓冲区;

 H 追加模板块的内容到内存中的缓冲区;

 g 获得内存缓冲区的内容,并替代当前模板块中的文本;

 G 获得内存缓冲区的内容,并追加到当前模板块文本的后面;

 l 列表不能打印字符的清单;

 n 读取下一个输入行,用下一个命令处理新的行而不是用第一个命令;

 N 追加下一个输入行到模板块后面并在二者间嵌入一个新行,改变当前行号码;

 p 打印模板块的行。 P(大写) 打印模板块的第一行;

 q 退出Sed;

 b lable 分支到脚本中带有标记的地方,如果分支不存在则分支到脚本的末尾;

 r file 从file中读行;

 t label if分支,从最后一行开始,条件一旦满足或者T,t命令,将导致分支到带有标号的命令处,或者到脚本的末尾;

 T label 错误分支,从最后一行开始,一旦发生错误或者T,t命令,将导致分支到带有标号的命令处,或者到脚本的末尾;

 w file 写并追加模板块到file末尾;

 W file 写并追加模板块的第一行到file末尾;

 ! 表示后面的命令对所有没有被选定的行发生作用;

 = 打印当前行号;

 # 把注释扩展到下一个换行符以前;

sed替换标记

 g 表示行内全面替换;

 p 表示打印行;

 w 表示把行写入一个文件;

 x 表示互换模板块中的文本和缓冲区中的文本;

 y 表示把一个字符翻译为另外的字符(但是不用于正则表达式);
 
 \1 子串匹配标记;

 & 已匹配字符串标记;

sed元字符集

^ 匹配行开始,如:/^sed/匹配所有以sed开头的行;
 
 $ 匹配行结束,如:/sed$/匹配所有以sed结尾的行;
 
 . 匹配一个非换行符的任意字符,如:/s.d/匹配s后接一个任意字符,最后是d;
 
 * 匹配0个或多个字符,如:/*sed/匹配所有模板是一个或多个空格后紧跟sed的行;
  
 [] 匹配一个指定范围内的字符,如/[ss]ed/匹配sed和Sed;
   
 [^] 匹配一个不在指定范围内的字符,如:/[^A-RT-Z]ed/匹配不包含A-R和T-Z的一个字母开头,紧跟ed的行;
  
 \(..\) 匹配子串,保存匹配的字符,如s/\(love\)able/\1rs,loveable被替换成lovers;
  
 & 保存搜索字符用来替换其他字符,如s/love/**&**/,love这成**love**;
  
 \< 匹配单词的开始,如:/\ 
 \> 匹配单词的结束,如/love\>/匹配包含以love结尾的单词的行;
 
 x\{m\} 重复字符x,m次,如:/0\{5\}/匹配包含5个0的行;
 
 x\{m,\} 重复字符x,至少m次,如:/0\{5,\}/匹配至少有5个0的行;
 
 x\{m,n\} 重复字符x,至少m次,不多于n次,如:/0\{5,10\}/匹配5~10个0的行;

实例 1:文件中新增字符串内容

1、创建一个 testfile 文件,如下:

2、 在 testfile 文件的第四行后添加一行,并将结果输出到标准输出,在命令行提示符下输入如下命令:

sed -e 4a\newLine testfile 

如下:

实例 2:文件中以行为单位的新增/删除

1、将 testfile 的内容列出并且列印行号

nl testfile

如下:

2、将 testfile 的内容列出并且列印行号,同时将第 2~5 行删除

nl testfile | sed '2,5d'

如下:

详细解释:

sed 的动作为 2,5d ,动作 d 是删除的意思,因为删除了 2-5 行,所以终端控制台显示的数据就没有 2-5 行, 另外,原本应该是要下达 sed -e 才对,但没有 -e 也是可以的,同时也要注意的是, sed 后面接的动作,请务必以  '...' 两个单引号括住。

注意:sed命令的执行结果只体现在打印到控制台上的结果改变,硬盘中的实际文件内容并未改变。例如:(在上述对文件的sed操作后,查看testfile文件内容并未改变) 

3、将 testfile 的内容列出并且列印行号,同时将第2行删除:

4、将 testfile 的内容列出并且列印行号,同时删除第3行到最后一行:

5、将 testfile 的内容列出并且列印行号,在第二行后(即加在第三行) 加上drink tea字样&&在第四行后(即加在第五行) 加上newLine字样:

 

6、将 testfile 的内容列出并且列印行号,同时在第二行前加上drink tea字样:

7、将 testfile 的内容列出并且列印行号,同时在第二行后面加上两行字,例如 Drink tea or .....  drink beer?

注意:每一行之间都必须要以反斜杠 \ 来进行新行标记。(上面的例子中在第一行的最后面就有 \ 存在)

实例 3:以行为单位的替换与显示

参考博客:https://www.runoob.com/linux/linux-comm-sed.html

参考博客:https://www.linuxprobe.com/linux-sed-command.html

posted @ 2022-03-24 20:29  习久性成  阅读(817)  评论(0编辑  收藏  举报