sed正则表达式

1、概述

sed是stream editor的简称,也就是流编辑器。他一次处理一行内容,处理时,把当前处理的行存储在临时缓存区,称为“pattern space”,接着用sed命令处理缓存区的内容,处理完成后,把缓存区的内容送往屏幕。接着处理下一行,这样不断重复,直到文件末尾。文件内容并没有改变,出发你使用重定向存储输出。

 

2、语法

命令格式

sed [option] 'command' input_file

 

option:

-n:使用silent模式。在一般的用法中,所有来自stdin的内容一般都会被列出到屏幕上。但如果加上-n参数后,则只有经过sed特殊处理的那一行才会被列出来

-e:直接在指令列模式上进行sed的动作编辑

-f:直接将sed的动作写在一个文件内,-f filename则可以执行filename内的sed命令

-r:让sed命令支持扩展的正则表达式 (默认是基础正则表达式)

-i:直接修改读取的文件内容,而不是有屏幕输出

 

常用命令:

a\:追加行,a\的后面跟上字符串s(多行字符串可以使用\n分隔),则会在当前选择的行后的后面都加上字符串s

c\:替换行,c\后面跟上字符串s(多行字符串都可以用\n分隔),则会将当前选择的行替换成字符串s

i\:插入行,i\后面跟上字符串s(多行字符串都可以用\n分隔),这会在当前选择的行的前面都插入字符串s

d:删除行delete,该命令会将当前选择的行删除

p:打印print,该命令会打印当前选择的行到屏幕上

y:替换字符,通常y命令的用法是这样的:y/Source-chars/Dest-chars/,分隔字符/可以用任意单字符替换,用Dest-chars中对应位置的字符串替换掉Source-chars中对应位置的字符串

s:替换字符串,通常s名领导用户是这样的:1,$s/Regexp/Replacement/Flages,分隔字符/可以用其他任意单字符替换,用Replacement替换掉匹配字符串

 

替换选项:

\digit:Replacement中可含有后引用中的\digit(digit是1至9),引用前面定义的子表达式

&:代表模式空间中的整个匹配部分

\L:将在其后的替换部分转换成小写字母,直到发现一个\u或\E,GUN扩展功能

\l:将下一个字符转换成小写字母,GNU扩展功能

\U:将在其后的替换部分转换成大写字母,直到发现一个\L或\E,GNU扩展功能

\u:将下一个字符转换成大写字母,GNU扩展功能

\E:停止由\L或\U指示开始的大小写转换,GNU扩展功能

 

标志选项

g:将用Replacement替换模版空间中所有匹配Regexp的部分,则不仅仅是第一个匹配部分

digit:只用Replacement替换模版空间中第digit(digit是1至9)个匹配Regexp的部分

p:若发生了替换操作,指示显示模版空间中新的数据

w file-name:若发生了替换操作,指示将模版空间中新的数据写入指定的文件file-name中

i:表示进行Regexp匹配时,是不区分大小写字母的

 

3、基本正则表达式

元字符

说明

*

将*前面的正则表达式匹配的结果重复任意次(含0次)。

\+

与星号(*)相同,只是至少重复1次,GNU的扩展功能。

\?

与星号(*)相同,只是最多重复1次,GNU的扩展功能。

\{i\}

与星号(*)相同,只是重复指定的i次。

\{i,j\}

与星号(*)相同,只是重复i至j次。

\{i, \}

与星号(*)相同,只是至少重复i次。

\(regexp\)

将regexp看作一个整体,用于后向引用,与\digit配合使用。

.

匹配任意单个字符。

^

匹配模版空间开始处的NULL字符串。

$

匹配的是模版空间结束处的NULL字符串。

[list]

匹配方括号中的字符列表中的任意一个。

[^list]

否定匹配方括号中的字符列表中的任意一个。

regexp1\|regexp2

用在相邻的正则表达式之间,表示匹配这些正则表达式中任一个都可以。匹配是从左向右开始的,一旦匹配成功就停止匹配。

regexp1regexp2

匹配regexp1和regexp2的连接结果。

\digit

匹配正则表达式前半部分定义的后向引用的第digit个子表达式。digit为1至9的数字, 1为从左开始。

\n

匹配换行符。

\meta

将元字符meta转换成普通字符,以便匹配该字符本身,有$、 *、 .、 [、 \ 和 ^。

 

扩展正则表达式

扩展正则表达式除了以下元字符与基本正则表达式不同外,其余相似。

基本正则表达式

扩展正则表达式

\?

?

\+

+

\|

|

\{ \}

{ }

\( \)

( )

 

常用转义字符

转义字符

说明

\a

匹配一个BEL字符。

\f

匹配一个换页字符。

\n

匹配一个换行字符。

\r

匹配一个回车字符。

\t

匹配一个水平Tab字符。

\v

匹配一个垂直Tab字符。

\cX

匹配Control+X,X是任意字符。

\dXXX

匹配一个ASCII码是十进制XXX的字符。

\oXXX

匹配一个ASCII码是八进制XXX的字符。

\xXX

匹配一个ASCII码是十六进制XX的字符。

\w

匹配任意一个单词字符(字母、数字和下划线)。

\W

匹配任意一个非单词字符。

\b

匹配一个单词的边界符:字符的左边是一个单词字符,并且右边是一个非单词字符,反之亦然。

\B

匹配除单词边界符外所有字符:字符的左边和右边同时是单词字符或非单词字符。

 

 

posted on 2020-04-05 22:49  gentleman_hai  阅读(7831)  评论(0编辑  收藏  举报

导航