06 2009 档案
摘要: NFA引擎最重要的性质就是,它会依次处理各个表达式或组合元素,遇到需要在两个可能成功的途经中进行选择的时候,它会选择其一,然后记住另一个选项,以备稍后可能的需要。一般需要做出选择的情形包括量词和多选结构。
阅读全文
摘要:原则一:优先选择最左端(最靠开头)的匹配结果;原则二:标准的匹配量词*、+、?、{min, max}是匹配优先的
阅读全文
摘要:正则引擎一般分为:DFA 引擎和传统NFA引擎. 一般支持忽略优量词就是传统NFA引擎,否则就是DFA或其他引擎.
阅读全文
摘要: 普通的无特殊意义的括号通常有两种功能:分组和捕获。 捕获型括号的编号是按照括号出现的次序,从左到右计算的。如果提供反向引用,可以在表达式的后面用\1,\2来引用匹配的文本。如:(a)(b)可以用\1引用(a),\2引用(b).
阅读全文
摘要:正则表达式能帮你节省时间、大量的时间,好多程序员在处理文本这个繁琐问题上花费“巨额”的时间,如果把这些时间省了,就会有更多时间做爱做的事。
正则表达式(Regular Expression )是强大,便捷、高效的文本处理工具。配合特定工具的支持,正则表达式能够添加、删除、分离、叠加、插入和修整各种类型的文本和数据。一旦掌握了它,就是知道它简直是工具中的无价之宝,个人感觉正则表达式就像一把“瑞士军刀”,经常让你方便的很,特别是在网络数据采集HTML处理方面。
阅读全文