【学习笔记】编译原理-有限自己主动机
一、定义:
不确定的有限自己主动机(NFA): 一种数学模型
(1) 一个有限的状态集合S
(2) 一个输入符号集合∑(不包括ε)
(3) 一个转换函数move: S X (∑ U {ε}) -> P(S)
(4) 状态s0是唯一的開始状态
(5) 状态集合F是接受状态集合,S包括F确定的有限自己主动机(DFA): 是NFA的特殊情况
(1) 不论什么状态都没有ε转换
(2) 对于不论什么状态s和不论什么输入符号a,最多仅仅有一条标记为a的边离开,即转换函数move: S X ∑-> S能够是一个部分函数。
二、表示:
1.NFA:
NFA能够用带标记的有向图表示,节点表示状态,有标记的边代表转换函数。
(a|b)*ab的NFA
(图1)
状态转换表
状态\输入字符 | a | b |
---|---|---|
0 | {0,1} | {0} |
1 | ø | {2} |
2 | ø | ø |
2.DFA:
(a|b)*ab的DFA
(图2)
三、NFA到DFA:子集构造法
步骤
如果有(a|b)*ab的NFA图中
(图3)
第一步:由起始位置配ε能够到达的全部状态集合{0,1,2,4,7}作为DFA的起始状态A;
第二步:确定字母表{a,b}
第三步:能够画出DFA的转换表Dtran的模型,(*表示未确定)
状态\输入字符 | a | b |
---|---|---|
A {0,1,2,4,7} | * | * |
第四步:寻找表中未确定项,比如[A,a],为该空确定转移状态,从图(1)可知集合A中的状态匹配输入字符a,能够转移到的状态集合为{1,2,3,4,6,7,8},该集合没有出现过,所以要在DFA的转换表Dtran的模型中添�该状态集。
状态\输入字符 | a | b |
---|---|---|
A {0,1,2,4,7} | B | * |
B {1,2,3,4,6,7,8} | * | * |
第五步:反复第四步,知道确定DFA的转换表Dtran
状态\输入字符 | a | b |
---|---|---|
A {0,1,2,4,7} | B | C |
B {1,2,3,4,6,7,8} | B | D |
C {1,2,4,5,6,7} | B | C |
D {1,2,4,5,6,7,9} | B | C |
第六步:依据DFA转换表就能够画出DFA的状态图。
伪代码
Q 为处理的集合队列
s 起始状态集合
G 为转换表
S = getSet(s, ε); //获得起始状态集S
为S分配一个唯一的标识码,比如(0),相应到G;
将S添�队列Q;
while(Q不为空) {
U = Q.front(), Q.pop(); // 取队列中的首项处理
for (对于字母表中的每一个字母) {
New = getSet(U, a); // a为当前考虑的字符,New为集合变量,接受处理得到的新集合
if (New == ø)
continue;
获得New集合的标识码,假设未出现,则在Q中添�New,并为New分配一个标识码。
G[U,New] = a;
}
}
对于getSet函数来说,给定一个集合U和匹配字符a,获得一个转移集合V,该函数须要注意边为ε的时候,由于NFA的边能够为ε。