大多数flex程序有二义性,相同的输入可能被多种模式匹配
flex通过下面2个规则来解决
- 匹配尽可能长的字符
- 如果2个模式都可以匹配, 匹配更早出现的那个模式
例子
"+" { return ADD; } "=" { return ASSIGN; } "+=" { return ASSIGNADD; } "if" { return KEYWORDIF; } "else" { return KEYWORDELSE; } [a-zA-Z_][a-zA-Z0-9_]* { return IDENTIFIER; }
以上模式中,因为 "+="更长,所以优先匹配
后三个关键字来说, 先匹配关键字