sed正则表达式

1、概述

sed是stream editor的简称，也就是流编辑器。他一次处理一行内容，处理时，把当前处理的行存储在临时缓存区，称为“pattern space”，接着用sed命令处理缓存区的内容，处理完成后，把缓存区的内容送往屏幕。接着处理下一行，这样不断重复，直到文件末尾。文件内容并没有改变，出发你使用重定向存储输出。

2、语法

命令格式

sed [option] 'command' input_file

option：

-n：使用silent模式。在一般的用法中，所有来自stdin的内容一般都会被列出到屏幕上。但如果加上-n参数后，则只有经过sed特殊处理的那一行才会被列出来

-e：直接在指令列模式上进行sed的动作编辑

-f：直接将sed的动作写在一个文件内，-f filename则可以执行filename内的sed命令

-r：让sed命令支持扩展的正则表达式（默认是基础正则表达式）

-i：直接修改读取的文件内容，而不是有屏幕输出

常用命令：

a\：追加行，a\的后面跟上字符串s（多行字符串可以使用\n分隔），则会在当前选择的行后的后面都加上字符串s

c\：替换行，c\后面跟上字符串s（多行字符串都可以用\n分隔），则会将当前选择的行替换成字符串s

i\：插入行，i\后面跟上字符串s（多行字符串都可以用\n分隔），这会在当前选择的行的前面都插入字符串s

d：删除行delete，该命令会将当前选择的行删除

p：打印print，该命令会打印当前选择的行到屏幕上

y：替换字符，通常y命令的用法是这样的：y/Source-chars/Dest-chars/，分隔字符/可以用任意单字符替换，用Dest-chars中对应位置的字符串替换掉Source-chars中对应位置的字符串

s：替换字符串，通常s名领导用户是这样的：1,$s/Regexp/Replacement/Flages，分隔字符/可以用其他任意单字符替换，用Replacement替换掉匹配字符串

替换选项：

\digit：Replacement中可含有后引用中的\digit（digit是1至9），引用前面定义的子表达式

&：代表模式空间中的整个匹配部分

\L：将在其后的替换部分转换成小写字母，直到发现一个\u或\E，GUN扩展功能

\l：将下一个字符转换成小写字母，GNU扩展功能

\U：将在其后的替换部分转换成大写字母，直到发现一个\L或\E，GNU扩展功能

\u：将下一个字符转换成大写字母，GNU扩展功能

\E：停止由\L或\U指示开始的大小写转换，GNU扩展功能

标志选项

g：将用Replacement替换模版空间中所有匹配Regexp的部分，则不仅仅是第一个匹配部分

digit：只用Replacement替换模版空间中第digit(digit是1至9)个匹配Regexp的部分

p：若发生了替换操作，指示显示模版空间中新的数据

w file-name：若发生了替换操作，指示将模版空间中新的数据写入指定的文件file-name中

i：表示进行Regexp匹配时，是不区分大小写字母的

3、基本正则表达式

元字符	说明
*	将*前面的正则表达式匹配的结果重复任意次(含0次)。
\+	与星号(*)相同，只是至少重复1次，GNU的扩展功能。
\?	与星号(*)相同，只是最多重复1次，GNU的扩展功能。
\{i\}	与星号(*)相同，只是重复指定的i次。
\{i,j\}	与星号(*)相同，只是重复i至j次。
\{i, \}	与星号(*)相同，只是至少重复i次。
$regexp$	将regexp看作一个整体，用于后向引用，与\digit配合使用。
.	匹配任意单个字符。
^	匹配模版空间开始处的NULL字符串。
$	匹配的是模版空间结束处的NULL字符串。
[list]	匹配方括号中的字符列表中的任意一个。
[^list]	否定匹配方括号中的字符列表中的任意一个。
regexp1\\|regexp2	用在相邻的正则表达式之间，表示匹配这些正则表达式中任一个都可以。匹配是从左向右开始的，一旦匹配成功就停止匹配。
regexp1regexp2	匹配regexp1和regexp2的连接结果。
\digit	匹配正则表达式前半部分定义的后向引用的第digit个子表达式。digit为1至9的数字, 1为从左开始。
\n	匹配换行符。
\meta	将元字符meta转换成普通字符，以便匹配该字符本身，有$、 *、 .、 [、 \ 和 ^。

扩展正则表达式

扩展正则表达式除了以下元字符与基本正则表达式不同外，其余相似。

基本正则表达式	扩展正则表达式
\?	?
\+	+
\\|	\|
\{ \}	{ }
	( )

常用转义字符

转义字符	说明
\a	匹配一个BEL字符。
\f	匹配一个换页字符。
\n	匹配一个换行字符。
\r	匹配一个回车字符。
\t	匹配一个水平Tab字符。
\v	匹配一个垂直Tab字符。
\cX	匹配Control+X，X是任意字符。
\dXXX	匹配一个ASCII码是十进制XXX的字符。
\oXXX	匹配一个ASCII码是八进制XXX的字符。
\xXX	匹配一个ASCII码是十六进制XX的字符。
\w	匹配任意一个单词字符(字母、数字和下划线)。
\W	匹配任意一个非单词字符。
\b	匹配一个单词的边界符：字符的左边是一个单词字符，并且右边是一个非单词字符，反之亦然。
\B	匹配除单词边界符外所有字符：字符的左边和右边同时是单词字符或非单词字符。

posted on 2020-04-05 22:49 gentleman_hai 阅读(8250) 评论(0) 编辑收藏举报

刷新页面返回顶部

gentleman_hai

sed正则表达式

导航

公告