sed学习笔记

sed是基于字符流的编辑器。要想很好的运用sed这一神器，必须懂得它的三个原理：

1、脚本中的所有编辑命令都将依次应用于每个输入行（也就是说sed是隐式全局的）；

2、命令应用于所有的行（全局的），除非程序员限制；

3、原始的输入文件并没有改变，编辑命令修改了原始文件的备份，并且将此备份发送到标准输出。

sed执行顺序是将所有编辑命令应用于第一行，处理结束之后再应用于第二行，依次类推，与我之前认为的相反。sed维护一个模式空间，也就是临时缓冲区，在应用编辑命令时，将文件的某一行存储在模式空间中，然后依次应用编辑命令。

在sed中一般用单引号将指令包围起来，单引号可以阻止shell解释编辑指令中的特殊字符或者空格。

有三种方式可以指定命令行上的多重指令：

1、在单引号中用分号分隔指令；

2、在每个指令前放置选项-e；

3、使用Bource shell的分行指令功能，即在单引号中按ENTER键。

默认情况下，sed自动将输出打印到标准输出（一般情况下是屏幕），也就是说默认操作是输出每个输入行（可以用选项-n阻止自动输出），我们可以将结果重定向到指定文件，但是必须保证该文件不是正在编辑的文件，否则会出现乱码。

sed命令可以指定零个、一个或两个地址。每个地址都是一个描述模式、行号或者行寻址符号的正则表达式：

1、如果没有指定地址，那么命令将应用于每一行；

2、如果只有一个地址，那么命令应用于匹配该地址的任何行；

3、如果指定了由逗号分隔的两个地址，那么命令应用于匹配第一个地址的第一行和它后面的行，直到匹配第二个地址的行（包括此行）。

4、如果地址后面有感叹号，那么命令将应用于不匹配该地址的所有行。

分组命令

sed使用大括号（{}）将一个地址嵌套在另一个地址中，或者在相同的地址上应用多个命令。如果想指定行的范围，然后在这个范围内指定另外的地址，则可以嵌套地址。

注意：左大括号必须在行末，而且右大括号本身必须单独占一行。要确保在大括号之后没有空格。

sed替换

语法：

[address]s/pattern/replacement/flags

flags选项：

n：1到512之间的一个数字，表示对文本模式中指定模式第n次出现的情况进行替换；

g：对模式空间出现的情况进行全局更改，而没有g选项时，只对第一次出现的情况修改；

p：打印模式空间的内容；

W file：将，模式空间的内容写到文件file中。

替换命令应用于address匹配的行，如果没有指定address，那么替换所有pattern匹配的行。如果正则表达式作为地址提供，并且没有指定模式，那么替换命令匹配由地址匹配的内容。地址需要一个作为定界符的斜杠（/），而正则表达式可以用任意字符分割（换行符除外）。

replacement：

replacement是一个字符串，用来替换正则表达式匹配的内容。在replacement部分，只有下列字符含有特殊含义：

&：用正则表达式的内容进行替换；

\n：匹配第n个字串，这个字串以前在pattern中用"\("和"\)"指定。

\：当在替换部分包含“与”符号（&），反斜杠（\）和替换命令的定界符可用\转义它们。另外，它用于转义换行符并创建多行replacement字符串。

posted @ 2012-03-21 23:50 leealways87 阅读(763) 评论(0) 编辑收藏举报

刷新页面返回顶部