linux 正则表达式

原文地址:http://www.cnblogs.com/Quincy/archive/2012/03/26/2418485.html

linux的正则表达式和js的基本没什么差别。所以不再详细研究了。网上摘了一篇文章。

在使用grepawksed命令时,需要使用正则表达式。
比如我通过grep找代码编译结果中是否有错误。或者是否有我代码的错误。
这里说下正则表达式基本的应用:


匹配行首与行尾。
匹配数据集。
只匹配字母和数字。
匹配一定范围内的字符串集。

   

^

只匹配行首

$

只匹配行尾

*

一个单字符后紧跟*,匹配0个或多个此单字符

[]

匹配[]内字符,可以是一个单字符,也可以是字符序列。可以使用 - 表示[]内字符序列范围,如用[1-5]代替[12345]

\

用来屏蔽一个元字符的特殊含义。因为有时在shell中一些元字符有特殊含义。\可以使其失去应有含义。

.

匹配任意单字符

pattern\{n\}

用来匹配前面pattern出现次数。n为次数

pattern\{n,\}

含义同上,但次数最少为n

patter\{n,m\}

含义同上,但pattern出现次数在nm之间

   

  1. 使用句点匹配单字符
    句点"."可以匹配任意单字符。例如,如果要匹配一个字符串,以be g开头,中间夹一个
    任意字符,那么可以表示为be g . n"."可以匹配字符串头,也可以是中间任意字符。
    ls-l命令中,可以匹配一定权限:
    .. . x . . x . . x
    此格式匹配用户本身,用户组及其他组成员的执行权限。
    ~$ ls -l |grep ...x..x..x
    drwxrwxrwx 1 h00209633 Domain U 0
    一月 19 08:38 bin
    drwxrwxrwx 1 h00209633 Domain U 0
    二月 7 08:06 emacs
    drwxrwxrwx 1 h00209633 Domain U 0
    一月 19 08:38 etc
    drwxrwxrwx 1 h00209633 Domain U 0
    一月 19 08:38 info
    drwxrwxrwx 1 h00209633 Domain U 0
    一月 19 08:38 leim
    drwxrwxrwx 1 h00209633 Domain U 0
    二月 7 09:05 lisp
    drwxrwxrwx 1 h00209633 Domain U 0
    二月 7 08:07 site-lisp
    ~$
  2. 在行首以^匹配字符串或字符序列
    ^
    只允许在一行的开始匹配字符或单词。例如,使用ls-l命令,并匹配目录。之所以可以
    这样做是因为ls-l命令结果每行第一个字符是d,即代表一个目录。
    ~$ ls -l |grep ^d
    drwxrwxrwx 1 h00209633 Domain U 0
    一月 19 08:38 bin
    drwxrwxrwx 1 h00209633 Domain U 0
    二月 7 08:06 emacs
    drwxrwxrwx 1 h00209633 Domain U 0
    一月 19 08:38 etc
    drwxrwxrwx 1 h00209633 Domain U 0
    一月 19 08:38 info
    drwxrwxrwx 1 h00209633 Domain U 0
    一月 19 08:38 leim
    drwxrwxrwx 1 h00209633 Domain U 0
    二月 7 09:05 lisp
    drwxrwxrwx 1 h00209633 Domain U 0
    二月 7 08:07 site-lisp
  3. 在行尾以$匹配字符串或字符
    可以说$^正相反,它在行尾匹配字符串或字符,$符号放在匹配单词后。假定要匹配以
    单词lisp结尾的所有行,操作为:
    ~$ ls |grep sp$
    lisp
    site-lisp
    ~$
  4. 使用*匹配字符串中的单字符或其重复序列
    使用此特殊字符匹配任意字符或字符串的重复多次表达式。例如:
    e*m(以e开头m结束的字符串)
    ~$ ls | grep e*m
    emacs
    leim
    ~$
  5. 使用\屏蔽一个特殊字符的含义
    有时需要查找一些字符或字符串,而它们包含了系统指定为特殊字符的一个字符。
    什么
    是特殊字符?
    一般意义上讲,下列字符可以认为是特殊字符:
    $ . ' " * [ ] ^ | { } \ + ?
    例如:找以.el后缀的文件
    ~/lisp$ ls | grep \.el$
    abbrev.el
    abbrevlist.el
    add-log.el
    align.el
    allout.el
    ansi-color.el
    apropos.el
    arc-mode.el
    array.el
    autoarg.el
    autoinsert.el
    autorevert.el
    avoid.el
    battery.el
    bindings.el
    bookmark.el
    bs.el
    buff-menu.el
    button.el
    calculator.el
    case-table.el
  6. 使用[]匹配一个范围或集合
    使用[]匹配特定字符串或字符串集,可以用逗号将括弧内要匹配的不同字符串分开,但并
    不强制要求这样做(一些系统提倡在复杂的表达式中使用逗号),这样做可以增加模式的可读
    性。
    使用"-"表示一个字符串范围,表明字符串范围从"-"左边字符开始,到"-"右边字
    符结束。
    如果熟知一个字符串匹配操作,应经常使用[]模式。
    假定要匹配任意一个数字,可以使用:
    [0123456789]
    然而,通过使用"-"符号可以简化操作:
    [0-9]
    或任意小写字母
    [a-z]
    要匹配任意字母,则使用:
    [A-Za-z]
    表明从A-Za-z的字母范围。
    如要匹配任意字母或数字,模式如下:
    [A-Za-z0-9]
    注意^符号的使用,当直接用在第一个括号里,意指否定或不匹配括号里内容。
    [^a-zA-Z]
    匹配任一非字母型字符,而
    [^0-9]
    匹配任一非数字型字符。
    通过最后一个例子,应可猜知除了使用^,还有一些方法用来搜索任意一个特殊字符。
  7. 使用\{\}匹配模式结果出现的次数
    使用*可匹配所有匹配结果任意次,但如果只要指定次数,就应使用\{ \ },此模式有三种
    形式,即:
    pattern\{n\}匹配模式出现n次。
    pattern\{n,\}
    匹配模式出现最少n次。
    pattern\{n,m}
    匹配模式出现nm次之间,n , m0 - 2 5 5中任意整数。

    例如格式如下:前4个字符是数字,接下来是xx,最后4个也是数字,
    操作如下:
    [0-9]\{4\}XX[0-9]\{4\}
    具体含义如下:
    1)
    匹配数字出现4次。
    2)
    后跟代码xx
    3)
    最后是数字出现4次。

posted on 2017-08-16 17:41  张小贱1987  阅读(123)  评论(0编辑  收藏  举报

导航