Linux下正则表达式的用法

在使用grep、awk和sed命令时，需要使用正则表达式。
比如我通过grep找代码编译结果中是否有错误。或者是否有我代码的错误。
这里说下正则表达式基本的应用：

• 匹配行首与行尾。
• 匹配数据集。
• 只匹配字母和数字。
• 匹配一定范围内的字符串集。

^	只匹配行首
$	只匹配行尾
*	一个单字符后紧跟*，匹配0个或多个此单字符
[]	匹配[]内字符，可以是一个单字符，也可以是字符序列。可以使用 - 表示[]内字符序列范围，如用[1-5]代替[12345]
\	用来屏蔽一个元字符的特殊含义。因为有时在shell中一些元字符有特殊含义。\可以使其失去应有含义。
.	匹配任意单字符
pattern\{n\}	用来匹配前面pattern出现次数。n为次数
pattern\{n,\}	含义同上，但次数最少为n
patter\{n,m\}	含义同上，但pattern出现次数在n与m之间

使用句点匹配单字符
句点“.”可以匹配任意单字符。例如，如果要匹配一个字符串，以be g开头，中间夹一个
任意字符，那么可以表示为be g . n，“.”可以匹配字符串头，也可以是中间任意字符。
在ls-l命令中，可以匹配一定权限：
.. . x . . x . . x
此格式匹配用户本身，用户组及其他组成员的执行权限。
~$ ls -l |grep ...x..x..x
drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 bin
drwxrwxrwx 1 h00209633 Domain U 0 二月 7 08:06 emacs
drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 etc
drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 info
drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 leim
drwxrwxrwx 1 h00209633 Domain U 0 二月 7 09:05 lisp
drwxrwxrwx 1 h00209633 Domain U 0 二月 7 08:07 site-lisp
~$
在行首以^匹配字符串或字符序列
^只允许在一行的开始匹配字符或单词。例如，使用ls-l命令，并匹配目录。之所以可以
这样做是因为ls-l命令结果每行第一个字符是d，即代表一个目录。
~$ ls -l |grep ^d
drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 bin
drwxrwxrwx 1 h00209633 Domain U 0 二月 7 08:06 emacs
drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 etc
drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 info
drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 leim
drwxrwxrwx 1 h00209633 Domain U 0 二月 7 09:05 lisp
drwxrwxrwx 1 h00209633 Domain U 0 二月 7 08:07 site-lisp
在行尾以$匹配字符串或字符
可以说$与^正相反，它在行尾匹配字符串或字符，$符号放在匹配单词后。假定要匹配以
单词lisp结尾的所有行，操作为：
~$ ls |grep sp$
lisp
site-lisp
~$
使用*匹配字符串中的单字符或其重复序列
使用此特殊字符匹配任意字符或字符串的重复多次表达式。例如：
找e*m（以e开头m结束的字符串）
~$ ls | grep e*m
emacs
leim
~$
使用\屏蔽一个特殊字符的含义
有时需要查找一些字符或字符串，而它们包含了系统指定为特殊字符的一个字符。什么
是特殊字符？一般意义上讲，下列字符可以认为是特殊字符：
$ . ' " * [ ] ^ | { } \ + ?
例如：找以.el后缀的文件
~/lisp$ ls | grep \.el$
abbrev.el
abbrevlist.el
add-log.el
align.el
allout.el
ansi-color.el
apropos.el
arc-mode.el
array.el
autoarg.el
autoinsert.el
autorevert.el
avoid.el
battery.el
bindings.el
bookmark.el
bs.el
buff-menu.el
button.el
calculator.el
case-table.el
使用[]匹配一个范围或集合
使用[]匹配特定字符串或字符串集，可以用逗号将括弧内要匹配的不同字符串分开，但并
不强制要求这样做（一些系统提倡在复杂的表达式中使用逗号），这样做可以增加模式的可读
性。
使用“-”表示一个字符串范围，表明字符串范围从“-”左边字符开始，到“-”右边字
符结束。
如果熟知一个字符串匹配操作，应经常使用[]模式。
假定要匹配任意一个数字，可以使用：
[0123456789]
然而，通过使用“-”符号可以简化操作：
[0-9]
或任意小写字母
[a-z]
要匹配任意字母，则使用：
[A-Za-z]
表明从A-Z、a-z的字母范围。
如要匹配任意字母或数字，模式如下：
[A-Za-z0-9]
注意^符号的使用，当直接用在第一个括号里，意指否定或不匹配括号里内容。
[^a-zA-Z]
匹配任一非字母型字符，而
[^0-9]
匹配任一非数字型字符。
通过最后一个例子，应可猜知除了使用^，还有一些方法用来搜索任意一个特殊字符。
使用\{\}匹配模式结果出现的次数
使用*可匹配所有匹配结果任意次，但如果只要指定次数，就应使用\{ \ }，此模式有三种
形式，即：
pattern\{n\}匹配模式出现n次。
pattern\{n,\}匹配模式出现最少n次。
pattern\{n,m}匹配模式出现n到m次之间，n , m为0 - 2 5 5中任意整数。
例如格式如下：前4个字符是数字，接下来是xx，最后4个也是数字，
操作如下：
[0-9]\{4\}XX[0-9]\{4\}
具体含义如下：
1)匹配数字出现4次。
2)后跟代码xx。
3)最后是数字出现4次。

posted @ 2019-04-26 12:39 Optimus·Light 阅读(242) 评论(0) 编辑收藏举报

刷新页面返回顶部

Light·Tse

The Internet is big, really big, like bigger than you thought big.

Linux下正则表达式的用法

公告

Light·Tse

The Internet is big, really big, like bigger than you thought big.

Linux下 正则表达式的用法

公告

Linux下正则表达式的用法