正则表达式就是处理字符串的方法,它是以行为单位来进行字符串的处理行为,正则表达式通过一些特殊符号的辅助,可以让用户轻易达到查找、删除、替换某特定字符串的处理程序。正则表达式基本上是一种“表示法”,只要工具支持这种表示法,那么该工具就可以用来作为正则表达式的字符串处理之用。
正则表达式就是处理字符串的方法,它是以行为单位来进行字符串的处理行为,正则表达式通过一些特殊符号的辅助,可以让用户轻易达到查找、删除、替换某特定字符串的处理程序。正则表达式基本上是一种“表示法”,只要工具支持这种表示法,那么该工具就可以用来作为正则表达式的字符串处理之用。
正则表达式字符
RE字符 |
意义 |
. |
匹配任意单个字符 |
[-] |
匹配括号里任意一个字符,也可以用-来表示范围。例如:[abc]或[a-z] |
[^] |
匹配不包括括号里的字符,例如:匹配非数字[^0-9] |
- | 匹配前一个字符任意次,包括0次
\? | 匹配前一个字符0到1次;使用egrep时,可以省略转义字符\
\+ | 匹配前面字符至少1次;使用egrep时,可以省略转义字符\
\{n,m\} | 匹配前一个字符至少n次最多m次;\{n\}匹配n次;\{n,\}匹配至少n次,最多不限;使用egrep时,可以省略转义字符\
^string | 匹配的字符串处于行首
string$ | 匹配的字符串处于行尾
\<PATTERN或\b | 匹配的字符串位于单词词首
PATTERN\>或\b | 匹配的字符串位于单词词尾
\<PATTERN\> | 匹配整个单词
\(PATTERN\) | 匹配括号里的组字符串,可以用变量\1,\2,\3...引用匹配到的内容;使用egrep时,可以省略转义字符\
范围字段表示
字符类 |
含义 |
[:alnum:] |
代表英文大小写字符及数字,即0-9,A-Z,a-z |
[:alpha:] |
代表任何英文大小字符,即A-Z,a-z |
[:lower:] |
代表小写字符,即a-z |
[:upper:] |
代表大写字符,即A-Z |
[:digit:] |
代表数字,即0-9 |
[:xdigit:] |
代表十六进制的数字类型,因此包括0-9,A-F,a-f的数字与字符 |
[:blank:] |
代表空格键与tab按键 |
[:graph:] |
除了空格与tab按键之外的其它所有按键 |
[:space:] |
任何会产生空白的字符,包括空格键,Tab键,CR等 |
[:cntrl:] |
代表键盘上面的控制按键,既包括CR,LF,Tab,Del等 |
[:print:] |
代表任意可打印字符 |
[:punct:] |
代表标点符号,即" ' ? ! ; : # $ |
应用举例
# 在/etc/passwd中查找用户名和所用shell同名的行
[root@oldboy68-23 ~]# egrep --color=auto "(^[^:]*\>).*\1$" /etc/passwd
sync:x:5:0:sync:/sbin:/bin/sync
shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
halt:x:7:0:halt:/sbin:/sbin/halt
- 范例说明:
- ([:]*\>)表示匹配不包括:字符的单词为行首的行
- \1$表示以()中匹配到的内容做为行尾
- .*表示任意字符任意多个
使用正则表达式的命令