摘要: 从基于规则到基于统计的语言模型的转变 基于马尔科夫假设,即任意一个词出现的概率只与它前面的词有关,可得到一个二元模型。乃至基于一个N-1阶马尔科夫假设,对应的语言模型是N元模型。一般N取值非常小,通常为2,可取到3或者4。 对于样本中未出现的零概率问题,使用古德-图灵估计方法进行平滑处理。对于出现频 阅读全文
posted @ 2018-09-04 09:12 ppwq 阅读(178) 评论(0) 推荐(0) 编辑