PHP正则表达式完全复习手册

正则表达式定义

    正则表达式,使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在很多文本编辑器里,正则表达式通常被用来检索、替换那些符合某个模式的文本。简单说,正则表达式就是用来匹配文本的表达式。

正则表达式组成

    包含:定界符、原子、元字符、修正符。

名词解释

    定界符:作为定界符常使用反斜线“/”,如“/apple/”。用户只需要匹配的模式内容放入定界符之间即可。作为定界符也不仅限于“/”。除了字母、数字和斜线“\”以外的任何字符都可以作为定界符。像“#”、“|”、“!”等都可以。

    原子:是正则表达式的最基本的组成单元,每个模式中最少包含一个原子。原子是那些未显示指定元字符的打印和非打印字符组成,具体分为5类。

        1.普通字符作为原子,例如:a~z A~Z 0~9

        2.一些特殊字符和转义后元字符作为原子,例如所有标点符号(但语句特殊意义的符号需要转义后才可作为原子,如:\" \' \* \+ \? \.)

        3.一些非打印字符作为原子,例如:\f   \n   \r   \t   \v   \CX

        4.使用“通用字符类型”作为原子,例如:\d   \D   \w   \W   \s   \S

        5.自定义原子表([])作为原子,例如:'/[api]sp/'     '^[api]sp/'

    元字符:用于扩展和限定原子功能,不能单独使用,必须与原子配合使用。

        

    修正符:修正正则表达式的作用。

    打印字符:就是所有能打印出来的字符,比如说a~z A~Z 0~9 !@#$%^&*()_+。非打印字符。

    非打印字符:比如说 回车。还有如下图

        

posted @ 2015-10-31 14:03  linwuxbc126  阅读(144)  评论(0编辑  收藏  举报