句法结构分析:基于PCFG的基本分析方法

PCFG:是基于概率的上下文无关文法,PCFG的规则表示为A—>α    p,A为非终结符,p为A推导出α的概率,相同左部的产生式概率分布满足归一化条件。

基于PCFG的句法分析模型中,假设满足以下三个条件:

1.位置不变性:子树的概率不依赖子树所管辖的单词在句子中位置;

2.上下文无关性:子树的概率不依赖子树控制单词以外的单词;

3.祖先无关性:子树的概率不依赖推导出子树的祖先节点。

PCFG三个基本问题(与HMM类似):

  a.给定一个句子W = w1w2wn和文法G,如何快速计算P(W|G)?

  b.给定一个句子W = w1w2wn和文法G,选择句法结构树 t 使得在W的所有结构树中有最大概率?

  c.给定一个句子W = w1w2wn和文法G,如何调节G的概率参数,使得句子的概率最大?即求解argMAXGP(W|G)。

为解决这三个问题,通常只考虑文法具有乔姆斯基范式的情况,对于任意一个CFG,都可以将其转化为CNF文法。

posted @ 2018-06-26 19:34  微冷不觉寒  阅读(1273)  评论(0编辑  收藏  举报