Linux正则表达式

正则表达式就是处理字符串的方法,它是以行为单位来进行字符串的处理行为,正则表达式通过一些特殊符号的辅助,可以让用户轻易达到查找、删除、替换某特定字符串的处理程序。正则表达式基本上是一种“表示法”,只要工具支持这种表示法,那么该工具就可以用来作为正则表达式的字符串处理之用。

正则表达式字符

RE字符 意义
. 匹配任意单个字符
[-] 匹配括号里任意一个字符,也可以用-来表示范围。例如:[abc]或[a-z]
[^] 匹配不包括括号里的字符,例如:匹配非数字[^0-9]
  • | 匹配前一个字符任意次,包括0次
    \? | 匹配前一个字符0到1次;使用egrep时,可以省略转义字符\
    \+ | 匹配前面字符至少1次;使用egrep时,可以省略转义字符\
    \{n,m\} | 匹配前一个字符至少n次最多m次;\{n\}匹配n次;\{n,\}匹配至少n次,最多不限;使用egrep时,可以省略转义字符\
    ^string | 匹配的字符串处于行首
    string$ | 匹配的字符串处于行尾
    \<PATTERN或\b | 匹配的字符串位于单词词首
    PATTERN\>或\b | 匹配的字符串位于单词词尾
    \<PATTERN\> | 匹配整个单词
    \(PATTERN\) | 匹配括号里的组字符串,可以用变量\1,\2,\3...引用匹配到的内容;使用egrep时,可以省略转义字符\

范围字段表示

字符类 含义
[:alnum:] 代表英文大小写字符及数字,即0-9,A-Z,a-z
[:alpha:] 代表任何英文大小字符,即A-Z,a-z
[:lower:] 代表小写字符,即a-z
[:upper:] 代表大写字符,即A-Z
[:digit:] 代表数字,即0-9
[:xdigit:] 代表十六进制的数字类型,因此包括0-9,A-F,a-f的数字与字符
[:blank:] 代表空格键与tab按键
[:graph:] 除了空格与tab按键之外的其它所有按键
[:space:] 任何会产生空白的字符,包括空格键,Tab键,CR等
[:cntrl:] 代表键盘上面的控制按键,既包括CR,LF,Tab,Del等
[:print:] 代表任意可打印字符
[:punct:] 代表标点符号,即" ' ? ! ; : # $

应用举例

# 在/etc/passwd中查找用户名和所用shell同名的行
[root@oldboy68-23 ~]# egrep --color=auto "(^[^:]*\>).*\1$" /etc/passwd
sync:x:5:0:sync:/sbin:/bin/sync
shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
halt:x:7:0:halt:/sbin:/sbin/halt

  • 范例说明:
    • ([:]*\>)表示匹配不包括:字符的单词为行首的行
    • \1$表示以()中匹配到的内容做为行尾
    • .*表示任意字符任意多个

使用正则表达式的命令

posted @ 2018-05-21 23:44  冰封眸  阅读(171)  评论(0编辑  收藏  举报