程序的格式##

分成显示的三部分由%%分割开来

definition section

rules section

正则模式##

notes :
1
这里的正则模式不同于大多数正则规则
非匹配符^ 会匹配到换行符
如果不想 [^abc] 匹配过一个整行的话

请使用 [^abc\n]

2
一个正则最多有一个后缀内容 / or $

start codition ^ <> 只能会出现在模式的开头

并且以上四个符号不不能呗 gourped 到一个括号里面去

^$不出现在正确的位置将被认为是一个普通的字符

以下两个例子是不合法的

foo/bar$ 出现了两个后缀内容
foobar

有两种 Start condition
一种是 inclusive(%s) 一种是 exclusive (%x)

使用begin 之后就是活跃的同时其他的 start codition 变得不活跃

对于 inclusive 来说没有start condition 的同样是活跃的
对于 exclusive 来说只有这种start condition 是活跃的

<*> 匹配任意的 start condition

模式的默认行为是 echo 任意没有被匹配上的字符就等价于
<*>.|\n echo;

begin(0) 是回到最初没有任何规则是活跃者的时候
等价于 BEGIN(INITIL)

begin 语句也可以作为一段 Indent code 放在 rule section 的开头

接受所有的注释

要注意的是 start condition 是 int 所以可以用一个int 来保存相应的数值

并且可以访问当前的 start condition 通过一个叫做 YY_START 的宏
有一个 alias 叫做 YYSTATE (兼容 unix tool lex)

start condition scope

使得 start condiditon scope 写起来更为方便

start condition 是可以嵌套的
所以就有了 start condition stack , 我们可以手动操作这个栈

栈大小无限制，用完内存空间就会报错

使用栈，需要包括一个前导 %option stack

特殊的字符 <> 指示了当遇到文件结束符的时候所要采取的特殊规则

当匹配到 <> 的时候并且 yywrap() 返回了一个非零的数（就是说没有更多的文件需要处理了）

指定 yyin 为一个新的输入文件（原来的版本还需要进行特殊的行为 YY_NEW_FILE 现在不用了）

执行一个 return 语句

执行特殊的yyterminate() action

或者切换到一个新的 buffer 使用 yy_switch _to_buffer ()

<> 匹配任何 start condition 中还没有 EOF的 start condition

发表于 2018-07-25 17:55 sfzyk 阅读(244) 评论(0) 收藏举报