lex初学总结（一）

最近在学习编译原理，写些lex&yacc的总结备忘。

根据《lex与yacc》中文第二版

I. RE的表示

匹配除\n外的任意字符

匹配符号前表达式的0次或多次出现（闭包）

匹配符号前表达式的1次或多次出现

？

匹配符号前表达式的0或1次出现

表达式间的逻辑或

用来指定范围，如： A-Z, 0-9, a-z等

[]

匹配括号内的任意字符,相当于("a"|"b"...)

[^...]

第一个字符是^的[]，匹配除括号内的任意字符

{}

指出一个模式可能出现的次数，如: A{1,3} 表示 A 可能出现1次或（到？）3次

“...”

双引号中的每个字符解释为字面意义（除了C转义字符外）

( )

将一系列RE组成一个新的RE

作为RE中的第一个字符匹配一行的开头

作为 RE中的最后一个字符匹配一行的结尾

转义元字符

条件匹配，当/后的表达式被满足时匹配/前的表达式，如：规则为 A0/1，输入 A01，则其中的A0 是匹配的

II. 内部变量（常用）

内部预定义变量：
yytext char * 当前匹配的字符串
yyleng int 当前匹配的字符串长度
yyin FILE * lex当前的解析文件，默认为标准输出
yyout FILE * lex解析后的输出文件，默认为标准输入
yylineno int 当前的行数信息

内部预定义宏：
ECHO #define ECHO fwrite(yytext, yyleng, 1, yyout)

　　也是未匹配字符的默认动作

内部预定义的函数：
int yylex(void)

　　调用Lex进行词法分析
int yywrap(void)

　　在文件(或输入)的末尾调用，如果函数的返回值是1，就停止解析。它可以用来解析多个文件，代码可以写在第三段，这样可以解析多个文件。方法是使用 yyin 文件指针指向不同的文件，直到所有的文件都被解析。最后，yywrap() 返回1来表示解析的结束。

yyless(int n)

　　这一函数可以用来送回除了前n个字符外的所有读出标记。

yymore()

　　这一函数告诉 Lexer 将下一个标记附加到当前标记后。

20110329

posted @ 2011-03-24 23:54 Jesse_Luo 阅读(815) 评论(0) 编辑收藏举报

刷新页面返回顶部

一岸涛声入梦来