摘要: 平滑 需要平滑原因有二:一,导致0概率,无法计算困惑度;二,对于一些未见过的句子,概率为0。 training set: denied the reports Test set: denied the offer P(offer| denied the) = 0 加1(拉普拉斯?) 平滑 Maxim 阅读全文
posted @ 2017-11-08 10:09 Fall12 阅读(1830) 评论(0) 推荐(0) 编辑
摘要: N-grams 语言模型 P(W) = P(W1,W2,W3...Wn) = P(W5|W1,W2,W3,W4) 计算给定句子的概率,主要说明了这些词语结合的如何上面的计算,依赖Chain Rule of Probability.主要是条件概率 P(A|B) = P(A,B)/P(B) P(A,B) 阅读全文
posted @ 2017-11-08 09:57 Fall12 阅读(307) 评论(0) 推荐(0) 编辑