大多数flex程序有二义性,相同的输入可能被多种模式匹配

flex通过下面2个规则来解决

  • 匹配尽可能长的字符
  • 如果2个模式都可以匹配, 匹配更早出现的那个模式

例子

"+" { return ADD; }
"=" { return ASSIGN; }
"+=" { return ASSIGNADD; }
"if" { return KEYWORDIF; }
"else" { return KEYWORDELSE; }
[a-zA-Z_][a-zA-Z0-9_]* { return IDENTIFIER; }

以上模式中,因为 "+="更长,所以优先匹配

后三个关键字来说, 先匹配关键字