只为成功找方向,不为失败找借口

每天都不能停止前进的脚步
  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

正则表达式引擎的规则

Posted on 2009-07-01 11:05  冰碟  阅读(312)  评论(0编辑  收藏  举报

规则1:正则表达式引擎会对输入字符串尽快地开始匹配。它一次搜索一个字符,直到发现一次匹配。

      例如:

      string = 123 ABC 456 DEF

      Regex = [A-Z]*

      这里会从ABC开始匹配

规则2:发现一个匹配的开头后,正则表达式引擎将继续匹配,直到遇到一个不被模式接收的字符。

      例如:

      string = 123 ABC 456 DEF

      Regex = [A-Z]*

      这里第一次匹配从ABC开始,当遇到模式不接受的空格时结束。

规则3:Regex引擎非常贪婪--只要模式允许,它将匹配尽可能多的字符。

      例如:

      string = 'Dr Watson's watch'

      Regex = '.*'

      这里会匹配'Dr Watson's watch',如果修改模式为'.*?',是“*”成为一个非贪婪的限定符。这时会匹配'Dr Watson'

规则4:Regex引擎渴望实现匹配,所以将在需要时回溯以实现匹配。

      例如:

      string = 'Hello world's said K & R.

      Regex = '.*'

      这里匹配'Hello world'。

      如果将模式设置为非回溯的“'(?>.*)'”这时就找不到匹配了。因为“.*”匹配了右侧直到结束的所有字符,并且不使用回溯,所以无法匹配。

规则5:Regex引擎总是选择第一个选项。

      例如:

      string = 1234 123 3456

      Regex = (\d{2}|\d{3}|\d{4})

      这里匹配结果是:

            12

            34

            12

            34

            56