摘要: 英语单词拼写检查是word提供的一个功能,使用google的时候也可以看到,当你打错字了,会给你提供一个备选。也就是给定一个词c,你应该提供一个候选的词w,这个词w应该是c因为打错一个字而产生的。即表述为argmax p(w|c). 利用贝叶斯定理即转换为 argmax p(c|w)p(w)/p(c) = argmax p(c|w)p(w). 挑选出词w由两个公式来描述,一个是p(w):这是词w的概率,可以称之为语言模型,一个是p(c|w):是词w产生词c的概率,可以称之为错误模型。 p(w):语言模型,用于描述一个词w在整个语言中的分布概率,如果出现多个词则可以称之为n-gram语言模型,. 阅读全文
posted @ 2012-07-24 20:30 追风人 阅读(699) 评论(0) 推荐(0) 编辑