句法结构分析:基于PCFG的基本分析方法——给定一个句子W = w1w2wn和文法G,如何快速计算P(W|G)
内向算法:将s—>w1w2···wn的概率分解为求P(S—>BC,B—>w1w2···wk,C—>wk+1···wn)k=1···n。
定义,内向变量:非终结符号A—>wiwi+1···wj的概率记为αij(A)。
αij(A)计算:
αii(A)= P(A—>wi);
αij(A)= ΣB,C Σk=ij P(A—>BC)αik(B)α(k+1)j(C)
故,P(S—>BC,B—>w1w2···wk,C—>wk+1···wn)= α1n(S)。
内向算法步骤:
1.输入PCFG 、G(S)、和句子w1w2···wn ;
2.求得αii(A)= P(A—>wi),i∈(1,n),(可能有多个非终结符号输出wi);
3.α1n(s)= ΣB,C Σk=1n P(S—>BC)α1k(B)α(k+1)n(C) (递归的求解α1n(s),可能有些αij(A)会被重复用到,故这里需要记录他们的值)