C语言词法分析中的贪心算法
C语言词法分析中的贪心算法
当我们写出a---b
这种语句的时候我们应该考虑C语言的编译器是如何去分析这条语句的。
C语言对于解决这个问题的解决方案可以归纳为一个很简单的规则:每一个符号应该包含尽可能多的字符。也就是说,编译器将程序分解成符号的方法是:从左到右一个一个字符的读入,字符一个字符地读入,如果该字符可能组成一个符号,那么再读入下一个字符,判断已经读入的两个字符组成的字符串是否可能是一个符号的组成部分;如果可能,继续读入下一个字符,重复上述判断,直到读入的字符组成的字符串已不再可能组成一个有意义的符号。这个处理策略有时被称为“贪心法”,或者,更口语化一点,称为“大嘴法”,Kernighan与Ritchie对这个方法的表述如下,“如果(编译器的)输入流截止至某个字符之前都已经被分解为一个个符号,那么下一个号将包括从该字符之后可能组成一个符号的最长字符串。”
---《C陷阱和缺陷》 第八页
需要注意的是,除了字符串与字符常量,符号的中间不能嵌有空白(空格符、制表符和换行符)。 例如, ==是单个符号, 而= =则是两个符号,
这种情况可以通过空格来区分,不要写出分复杂的代码。完全可以将a---b
写成a-- -b
中间的空格在于度上带来了一定的方便而且避免了可能发生的错误,在这里a---b
与a- --b
的含义是不同的。
同样地, 如果I是为判断下一个符号而读入的第一个字符, 而I之后 紧接着*,那么无论上下文如何, 这两个字符都将被当作一个符号/*,表示一段注 释的开始。
根据代码中注释的意思, 下面的语句的本意似乎是用 x除以 p 所指向的值, 把所得的商再赋给 y
y = x/*p /* p指向除数*/
而实际上,/*被编译器理解为一段注释的开始, 编译器将不断地读入字符, 直到*/出现为止。 也就是说, 该语句直接将x的值赋给 y, 根本不会顾及到后面 出现的p。 将上面的语句重写如下:
y = x / *p /* p指向除数*/;
或者更加清楚一点, 写作:
y=x/(*p) /*p指向除数*/;
这样得到的实际效果才是语句注释所表示的原意。