摘要: 古德-图灵估计可以解决n元语法模型(n-gram)中的数据的稀疏问题。主要的思想是把非零的n元语法的概率降低匀给一些低概率n元语法,以修改最大似然估计与真实概率之间的偏离。是实用比较多的平滑算法。 图:从左到右的变化:把一部分看得见的事件的概率匀给未看见的事件 ... 阅读全文
posted @ 2014-12-20 22:56 jihite 阅读(6945) 评论(0) 推荐(1) 编辑